Unicode: Za oponou
Konsorcium Unicode minulý rok oslavilo své 25. výročí. Pravda je taková, že navzdory veškerému práci Unicode zajistí, aby text z jazyků po celém světě pracoval – většina z nás zná Unicode jako skupinu, která schvaluje nové emodži.
To, co nemusí být tak jasné, je důvod, proč je vyžadováno velké konsorcium nebo skrytá složitost Unicode. Nebo jak jsou zvracení emodži zobrazeny ve výše uvedené karikatuře XCKD již považovány za „platné (ale nedoporučované)“.
Mark Davis, spoluzakladatel a současný prezident Unicode, se snažil objasnit, jak Emoji zapadá do Unicode v tomto přehledu na vysoké úrovni, který se zaměřuje na to, co je Unicode a jak se podvýbor Emoji Emoji („Emoji SC“) zapadá to.
Davis poznamenává, že emodži tvoří jen zlomek celkového počtu znaků ve standardu Unicode. V tomto grafu je sotva můžete udělat:
Samotné postavy neříkají polovinu příběhu. Při zobrazení v určitých objednávkách nebo kombinacích se musí kombinovat řada glyfů.
Kombinace, která bude mnoha známá, je to, jak jsou implementovány tóny kožních tónů emodži.
Tato práce detekují, když se zobrazí znak modifikátoru po lidském emodži, jako je 👧 dívka. Tito se kombinují na podporovaných platformách, aby zobrazily jediný emoji:
Složitější implementace zahrnuje spojování dvou nebo více emodži do toho, co se nazývá sekvence emoji ZWJ.
Ty se používají k vytvoření profesí, jako je soudce žen. Tento emoji je vytvořen pomocí emodži 👩 žen a ⚖ rovnovážní stupnice.
Mezi těmito dvěma emodži stojí postava „ZWJ“ (nulová šířka truhláře) a je to neviditelné lepidlo, které se připojuje k více emodži do jednoho (kde je podporováno).
Jiné typy sekvencí ZWJ uvádějí existující emodži, jako je 🕵 Detektiv se symbolem pohlaví ♀ po něm přidaném ženském znaku.
Tento typ sekvence ZWJ se obecně používá, pokud již existuje emoji. Například: běžec, surfer nebo mnoho gest.
A ano, můžete kombinovat modifikátory a ZWJ a vytvořit delší sekvenci.
Unicode nekontroluje sekvence ZWJ stejným způsobem jako nové emodži, které vyžadují svůj vlastní kódový bod.
Unicode doporučené sekvence, které by měly být podporovány pro konzistenci napříč platformami. Prodejci však mohou svobodně kombinovat jakýkoli emodži s jiným, jak považují za vhodné.
Microsoft má v systému Windows k dispozici šest koček Ninja, které nejsou součástí doporučeného seznamu Unicode. 🐱 Cat Face a 🚀 Rocket jsou kombinovány ve Windows 10, aby ukázaly emodži pro 🐱🚀 astro kočku.
Astro Cat je platná (protože používá správnou sekvenční strukturu), ale nedoporučuje se jako jiné profese a pohlaví.
XKCD navrhl, že zvrat by měl být znakem modifikátoru, aby vytvořil „zvracení kovboje“.
Davis poukazuje na to, že obličej kovbojského klobouku by již mohl být kombinován s zvracením obličeje a vytvořil platnou sekvenci ZWJ:
Pro emodži existují další typy sekvencí, včetně sekvencí FLAG, sekvencí značek a sekvencí keycap. Měli byste se podívat na celou sadu snímků, abyste je viděli podrobněji.
Nakonec se podíváme na časovou osu (aktuální, 2017), jak se narodí nový emoji:
🚨 Aktualizace dubna 2020: Aktuální časová osa pro to, jak je nový emodži vytvářen, byla významně ovlivněna pandemií Covid-19. Více o revidovaném rozvrhu pro rok 2020 a dále si můžete přečíst.
Unicode má samozřejmě stále co dělat mimo podporu emodži:
„Existuje přibližně 7 000 živých lidských jazyků, s různou úrovní vitality. Méně než 100 z těchto jazyků je dobře podporováno na počítačích, mobilních telefonech a dalších zařízeních, zatímco zbytek riskuje, že je digitálně znevýhodněn“
Unicode má adopci charakterového programu. Fondy získané z adopcí směřují k výzkumu na podporu těchto digitálně znevýhodněných jazyků.
Více:
Unicode emoji od Marka Davise
Unicode přijme postavu
Nové emodži pro rok 2017
Zábavné emodži hackes
Hledat emodži: