Тем, кто бороздит просторы интернета известен пункт меню в браузере под названием кодировка. Он содержит целый ворох кодировок символов. Если кодировка определена не правильно, то и прочитать ничего не получится. Такой разнобой сложился исторически. Кодировка Unicode является попыткой охватить все и сразу, чтобы не было необходимости во всей этой массе кодировок.
Google отметила, что интернет постепенно переходит на это универсальное решение и Unicode используется уже в более чем 60% веба. 31 января Google представила новую версию Unicode — 6.1. В ней содержится около 110 тысяч символов. Кодировку изобретали с расчетом охвата всех символов, а не только 256. Т.е. в Unicode есть практически все буквы всех языков мира, включая смайлики и около 75 тысяч китайских иероглифов.
Всего в Unicode может влезть более миллиона символов. Несмотря на то, что изобрели Unicode тогда же, когда и веб, внедрять кодировку начали в 2003-2004. До 2006 года это делалось не очень спешно, затем дело пошло лучше и к 2008 году Unicode стала самой популярной в вебе.