Компьютерная программа Переводчик Google приложение для Android. Непонятные символы вместо текста в браузере

30.04.2019

Радостно бежала к компьютеру, чтобы рассказать миру о своём открытии. Оказалось, я не первая Ну что ж) Пообещала себе не читать ни одного отзыва из этой ветки, пока не напишу свой. Так что будьте уверены - это не рерайт и не плагиат. Ко всему пришла сама. Офигеть гений

Японскую, корейскую и даже китайскую косметику любят, особенно на Irecommend. Однако при написании отзыва или выборе товара камнем преткновения может стать отсутствие наклейки с переводом состава. Авторы обычно понуро разводят руками: дескать, нет описания на английском, звиняйте. Раньше и я такой была. А потом меня осенило, что наверняка в 21 веке найдётся способ распознать иероглифы. И кто нам тут поможет, как не всемогущий Гугл?

Итак, знакомимся - приложение Google Переводчик для Андроид Для iOS и Windows Phone, я уверена, тоже есть версия.

Где найти? В моём случае, конечно, это Play Market. В случае других ОС - аналогичные магазины приложений.

Цена: приложение полностью бесплатно, но показывает нам рекламу. Отключить её за деньги нет возможности. (Поправьте меня, если я не права)

Функционал: приложение умеет распознавать и переводить текст:

  • в печатном виде - классика, всё работает на отлично. Главное - помнить, что лучше переводить отдельные слова, а не целые предложения;
  • в рукописном виде - для моих кривых лапок не самый удобный способ. Лично мне проще напечатать;
  • с микрофона : если по-русски гугл меня ещё понимает, то на моём корявом английском максимум можно произнести «Hello! How are you?». Даже фразу «I Recommend» я произношу как-то не так xD

Можно просто сфотографировать текст с упаковки средства, можно скачать фотографию или сделать скриншот (так я делаю, когда в отзывах сфотографированы только иероглифы. Спасибо тем, кто снимает состав, даже не собираясь заниматься его разбором ).

Есть ещё такая забавная вещь, как мгновенный перевод . Вы только навели камеру на коробочку, и тут же на ваших глазах корейский, к примеру, язык превращается в английский. Выглядит как какая-то чертовщина

Пошагово рассказываю , как перевести иероглифы с картинки на понятный нам язык. В роли иероглифов выступает корейский язык, в котором на самом-то деле не иероглифы, а алфавит. Но согласитесь, что нам, простым обывателям, всё то, что далеко от латиницы и кириллицы - иероглифы Итак, распознаём корейский текст.

1. На главном экране приложения нужно выбрать язык. Так как я обычно интересуюсь составом средства, мне привычнее видеть его на английском языке.

2. Нажимаем на кнопку в виде фотоаппарата.

3. Фокусируемся на нужной области, снимаем.

4. На следующем экране выделяем текст. Я обычно пользуюсь кнопкой «Выделить всё».

5. Появляется кусок переведённого текста со стрелкой. Нажимаем на него, чтобы просмотреть текст полностью. На этом экране можно копировать текст в буфер обмена и делать с ним что душе угодно.


Так, например, я узнала, что моя краска для волос , несмотря на технологию окрашивания, не подразумевающую использование окислителя, содержит гидроксид аммония о_О Текст со скрина выше:

Ingredients: purified water, ethanol, glycollic acid benzyl alcohol, methylpyrrolidone, glycerin, propylene glycol, hydroxycellulose cellulose, ammonium hydroxide , nonoxy 12, hydrolyzed collagen, (T), color No. 401 (t), purple color No. 401 (t), orange color No. 401 (t) Yellow No. 403-1 (Red, No. 401, No. 227, Red No. 201, Yellow No. 4, Red No. 106, Blue No. 1, Purified water, ethanol, glycerin, glycol distearate pigment-12 dimethicone, benzyl alcohol, methylpyrrolidone settimonium chloride, polyquaternium-10, hydroxyethyl cellulose Acid, panthenol, wenna extract, Isothiazolinone / methyl isothiazolinone, fragrance.

Вернёмся к приложению . Оно полезное, но какие же я обнаружила минусы ?

  • Несмотря на обширную базу языков, там отсутствует, к примеру, татарский . Обидно, знаете ли! А вдруг я приехала в Казань и ломаю голову над тем, что такое бәдрәф? В этом случае придётся применить аналогичный сервис от Яндекса. Который, кстати, не умеет распознавать корейский текст.
  • Также не для всех языков, символы которых отсутствуют на стандартных клавиатурах, есть функция распознавания текста по фото. Например, «щёлкнуть» грузинский и тайский текст вы не сможете.

В остальном - отличная штука. Кто ещё не знает, что налито в его азиатских баночках - настоятельно рекомендую Google переводчик для мобильного

2006 год стал вехой в истории Google: Оксфордский словарь английского языка принял слово «гуглить». Понятие стало нарицательным. С тех пор искать в Сети - значит гуглить. «Корпорация добра» сильно влияет на наше поведение в интернете: мы следуем деловому этикету Gmail, открываем окно в мир, запуская Chrome каждое утро, и используем Google Drive для продуктивной работы.

Причина популярности «Google Документов» в облачном принципе работы. Из всех инструментов «Google Диска» текстовый редактор самый необходимый для выполнения повседневных задач.

Чтобы сделать работу с «Google Документами» более продуктивной, используйте следующие десять рекомендаций.

Бонус: добавьте Google Docs в меню запуска на панели задач Windows или Mac. Два клика - и вы в «Документах».

Быстрый поиск

Найти тот или иной файл или папку можно легко и быстро, если ввести ключевую фразу в строку поиска вверху. Маленькая стрелочка справа поможет уточнить критерии поиска:

  • тип файла (папка, документ, фотография, PDF и так далее);
  • открыть с помощью Google Docs, Google Drawing, Google Sheets, любым установленным аддоном;
  • владелец (я, не я, кто угодно).

Ещё одна штука, упрощающая поиск, - использование точной цитаты, относящейся к файлу, который хотите найти. Google Drive откроет документ и подсветит использованную поисковую фразу. Кроме того, как и при гуглении, можно применять булевы операторы вроде or для расширения границ поиска.

Нажмите «/» для перехода в поле поиска.

Полный список поисковых опций «Google Диска» смотрите . И последнее: не забывайте искать в корзине.

Быстрый переход в меню «скрытых» команд

Google Docs похож на другие офисные пакеты. Возможно, он попроще Microsoft Word, но в меню тоже множество полезных команд. Нажмите «Alt + /», чтобы перейти к поиску по меню. Введите в открывшемся поле то, что ищите, и функция запустится.

При помощи поиска по меню можно обнаружить и другие инструменты редактирования, имеющиеся в Google Docs.

От идеи в Google Keep до черновика в Google Docs

Прекрасный сервис для создания и хранения заметок. Его лучшие функции: возможность надиктовывать заметки и распознавать текст с фотографий. Но знаете ли вы, что можно в один клик заметку превратить в документ?

Благодаря такому экспорту можно редактировать и «полировать» свои идеи уже в Google Docs. Незаменимо для студентов и пишущих людей - немало экономит время.

Анализируем свой словарный запас с Word Cloud

Копирайтеры, блогеры, студенты и преподаватели могут использовать облако слов или облако тегов, чтобы быстро сориентироваться в содержании документа. Также это поможет увидеть, какими словами вы злоупотребляете.

Использовать генератор облака слов - Tag Cloud Generator - можно в любом документе, состоящем из 50 и более слов. Бесплатное Google-Drive-дополнение можно найти и установить из меню Add-ons → Get Add-ons…

Пользоваться облаком слов можно через то же меню. Оно будет отображаться в маленьком окне справа. Если документ не окончен, вы продолжаете редактирование, то время от времени нажимайте кнопку Refresh Cloud, чтобы обновлять облако тегов.

Tag Cloud Generator работает также в таблицах. Единственный минус - панель, где отображаются употребляемые слова, нельзя масштабировать.

Найти и вставить в один клик

Благодаря инструменту Research вам не нужно покидать документ, в котором работаете, чтобы загуглить какую-то информацию. Ведь открытие новой вкладки в браузере тоже занимает время. Это встроенный инструмент позволяет находить и вставлять информацию в используемый документ или таблицу. Откройте Tools → Research (Ctrl + Alt + Shift + I).

Справа появится окно поиска. Там вы сможете в один клик поставить ссылку на цитату, вписав её вручную или просто выделив.

Доступные форматы цитирования: MLA, APA и Chicago.

Причём красиво обрамлённые цитаты - только одна из фишек Research Tool. Ещё можно ссылаться на статистические данные в таблицах. При использовании поиска можно также персонализировать выдачу, чтобы отображались ваши публикации в Google+, ваши письма и так далее. Для всего этого есть специальные фильтры.

Быстрое форматирование текста в разных местах

В Google Docs есть инструмент Paint format, который позволяет создавать шаблоны форматирования и применять их к любому участку текста. Выделите слово, предложение или любой другой фрагмент текста, отредактируйте его: задайте размер, шрифт и прочее. Затем нажмите Paint format. После этого вы сможете применить заданные параметры форматирования к другому фрагменту, стоит лишь кликнуть на него.

«Пфф! Это работает только один раз!» - скажут скептики. Если нужно применить заданные параметры форматирования больше одного раза, кликните по иконке Paint format дважды. Чтобы «волшебство» прекратило действовать, вновь нажмите эту кнопку.

Использование royalty-free-картинок

Google Docs включает в себя поиск по «Картинкам Google», что позволяет оперативно находить и вставлять изображение в документ. Но есть ещё два богатых источника картинок - это LIFE и Stock Photos. Изображения из архива LIFE имеют лицензию, дающую право использовать произведение даже коммерчески, но нужно обязательно указывать авторство. В 2012 году Google отобрал пять тысяч новых фото в категориях «Природа», «Погода», «Животные», «Спорт», «Еда», «Образование», «Технологии», «Музыка» и других.

Google предупреждает, что картинки доступны для личного и коммерческого пользования только внутри Google Drive и должны использоваться в рамках политики сервиса.

Можно вставлять картинки с помощью URL. Изображение сохранится в вашем документе и будет доступно, даже если оригинал удалят из Сети.

Упоминание кого-то при комментировании

Совместная работа в «Google Документах» строится на комментировании. При этом есть быстрый способ обратить внимание человека на определённый комментарий. Выделите нужный фрагмент текста и нажмите «добавить комментарий» (Insert → Comment). В открывшимся поле для комментирования впишите «@» или «+» и начните вводить имя нужного человека.

Google Docs автоматически выберет персону из вашего списка контактов Gmail и проинформирует её по email. Если у этого человека нет прав для просмотра данного документа, вам нужно дать ему доступ.

Шорткаты для математических формул

В Google Docs есть удобный редактор математических выражений: Insert → Equation. При помощи него можно не только набирать математические выражения, но и удобно работать над ними с коллегами.

Чтобы ускорить процесс, пользуйтесь шорткатами. Например, если вы введёте «\alpha» с последующим пробелом и скобкой, Google Docs конвертирует это в символ α. Также вы сможете легко добавлять верхний или нижний индекс, вводя соответственно «^» и «_». Для дробей введите «\frac».

Полный список шорткатов для математических выражений . Для создания более сложных формул используйте бесплатное расширение g(math) Google Drive для Chrome.

Другие шорткаты для экономии времени

Нажмите «Ctrl + /» и увидите большой список шаблонов для быстрого управления документом. Многие навигационные клавиши совпадают с Gmail. Кроме того, можно создавать собственные шорткаты.

Перейдите в Tools → Preferences → Automatic Substitution.

Вы можете использовать это для автоматической вставки часто используемых слов, email-адресов, аббревиатур или даже слов, в которых постоянно делаете опечатки.

Также необходимо отметить «Автоматическое определение ссылок» и «Автоматическое определение списков» в диалоговом окне настроек.

Конечно, вы можете возразить, что самый быстрый способ создать красивый документ - использовать . Но описанные маленькие хитрости помогут ускорить работу и с ними.

Пишите в комментариях, какими трюками пользуетесь вы в повседневной работе с «Google Документами».

Когда дело доходит до ввода китайских иероглифов на компьютере – требуется нечто большее, чем просто клавиатура.

Далекие от китайского языка люди, до сих пор думают, что все китайские клавиатуры выглядят примерно так:

Китайская клавиатура

Но мы-то с вами знаем, что китайцы – нормальные люди и пользуются совершенно обычными, стандартными клавиатурами.

Итак, что же требуется для ввода китайских иероглифов?

Все дело в специальном IME (Input Method Editor ).

IME – это программа или компонент операционной системы, дающий возможность пользователям вводить на клавиатуре символы, которых даже нет на обычной клавиатуре. В нашем случае, позволяет вводить китайские иероглифы, используя клавиатуру с английской раскладкой.

Для ввода китайских иероглифов можно воспользоваться Microsoft IME , уже по умолчанию встроенным в операционную систему Windows . Но не спешите вводить китайские иероглифы с помощью встроенного Microsoft IME. В мире китайского языка существуют более удобные сторонние программы.

Давайте расширим наши горизонты, отойдем от встроенного в операционную систему китайского IME и взглянем на Google Pinyin IME (распространяемый бесплатно), так как он на несколько голов превосходит уже упомянутый Microsoft IME. Конечно, программа Google Pinyin IME во многом похожа на стандартный MS IME , но она гораздо быстрее и проще в обращении. Плюс, ее можно свободно загрузить и установить на буквально в считанные секунды!

Сразу приведу несколько особенностей программы для ввода китайских иероглифов Google Pinyin IME :

1. Легкое переключение между английским и китайским языками без необходимости изменения раскладки. Просто один раз нажмите на клавишу «Shift » и раскладка поменяется с китайской на английскую и наоборот.

2. Видимая панелька управления позволяет легко добавлять знаки тона для пиньиня и переключаться между упрощенными и традиционными иероглифами в считанные секунды.

3. Процесс набора китайского текста идет быстрее за счет встроенного режима предложения. Вы просто продолжаете печатать на китайском, а программа самостоятельно исправляет неправильные иероглифы в приложении, подбирая их по смыслу.

И это лишь малая часть всех особенностей этой небольшой программки! Лишь вершина айсберга под названием Google Pinyin IME!

Теперь, когда мы узнали об особенностях, давайте познакомимся с Google Pinyin IME немного поближе.

Общая информация о Google Pinyin IME

Google Pinyin Input Method поддерживает операционные системы Windows 7 , Windows Vista , Windows XP . Последняя версия программы Google Pinyin IME 2.7.22.120 будет работать и на новой операционной системе Windows 8 .

Интерфейс Google Pinyin IME полностью на китайском языке. Поддержка других языков у интерфейса не предусмотрена.

Чтобы скачать программу для ввода китайских иероглифов Google Pinyin IME, зайдите на официальный сайт http://www.google.com/intl/zh-CN/ime/pinyin/ и нажмите на длинный синий прямоугольник.

После загрузки установщика на свой компьютер, его останется запустить и следовать простым инструкциям по установке. На самом деле процесс установки довольно простой и даже не знакомые с китайским языком пользователи могут установить Google Pinyin на свой компьютер.

Панель управления Google Pinyin IME

После установки программы Google Pinyin Input Method, нажмите на языковую панель (RU , EN или CH ), для выбора китайского языка (CH ), и выберите Google IME (谷歌 ). Панель управления Google Pinyin отобразится в нижнем правом углу экрана.

Панель управления

Чтобы проверить, как она работает, вы можете самостоятельно понажимать на все символы по очереди, благо их не так много.

Вначале, если смотреть слева на право идет логотип Google pinyin.

Следом за логотипом расположился иероглиф . Он показывает, что в данный момент времени установлена китайская раскладка и можно печатать на китайском языке. Если рядом с логотипом стоит иероглиф , то раскладка клавиатуры английская и печатать, соответственно, можно только на английском языке. Переключить раскладку можно нажатием левой кнопки мышки по иероглифу. Существует еще один способ переключения раскладки, но о нем я расскажу ниже.

Иконка луны – бесполезная опция изменяющая ширину шрифта. Запомните, что луна на панели управления Google pinyin должна быть полумесяцем. Если вы измените луну на полную, то это повлияет на шрифт английского текста.

Как минимум, странное решение вывести данный значок на панель управления со стороны Google. Идея с полумесяцем и луной, конечно интересная, но польза от самой функции стремится к числу похожему на полную луну т.е. к нулю.

Иконка точки и запятой – позволяет переключаться между обычными и китайскими знаками препинания. Да, да в китайском языке точка похожа на маленький нолик, ну или пончик, кому как больше нравится.

Иконка клавиатуры – это, собственно, обычная виртуальная клавиатура. Никаких отличий и особенностей у этой виртуальной клавиатуры нет, да не не должно быть. Она просто выполняет свою функцию.

Виртуальная клавиатура

Зачем на виртуальной клавиатуре аж по 3 раза продублировали буквы на каждой кнопке, для меня, если честно, загадка. Видимо, в Google посчитали, что так пользователь точно не ошибется с выбором нужной ему буквы.

Иконка микрофона – это голосовой набор. После прочтения политики конфиденциальности и принятия соглашения от компании Google, у вас появится возможность вводить китайские иероглифы с помощью голоса. Данная функция может пригодиться, если вы вдруг устанете набирать иероглифы на клавиатуре, а под рукой совершенно случайно окажется микрофон.

Отличная функция, но если у вас не все в порядке с произношением, то она может превратиться в настоящую пытку. Приготовьтесь к худшему! Ваше словесное кунг-фу будет побеждено безжалостной и бездушной машиной. Фразы 我会说中文 – для победы недостаточно. От вас потребуется максимальная концентрация на произношении звуков, и…. тонов! Только при условии соблюдения всех этих условий, вы сможете ввести голосом именно нужные иероглифы, а не непонятный набор набор символов и знаков.

В любом случае, это отличный бесплатный тренажер для отработки произношения китайских слов. Если Google понимает ваш китайский, то и китайцы будут его понимать.

Иконка шестеренки – открывает дополнительное меню Google Pinyin IME.

Дополнительные опции

Если вы не видите панели управления, то щелкните правой кнопкой мышки на языковой панели и выберите в появившемся меню пункт «Восстановить языковую панель». После этого, в самом верху или низу экрана появится увеличенная языковая панель, в которой отображаются все языки ввода установленные на компьютер.

Затем, в выпадающем меню, выберите китайский метод ввода, и вы сразу увидите появившуюся панель управления Google pinyin. Если вы хотите убрать языковую панель, то можно нажать по ней правой кнопкой мыши и выбрать пункт «Свернуть», после чего расширенная языковая панель операционной системы Windows исчезнет.

Ввод предложений

Вместо отдельных слов, вы можете вводить целые предложения. Это значит, что скорость набора китайского текста может быть значительно увеличена. При наборе текста вам не нужно останавливаться, чтобы самостоятельно выбрать напечатанные слова. Просто продолжайте печатать дальше, а программа сама определит и автоматически подставит нужные иероглифы в предложение.

Переключение между китайским и английским языком

Если у вас появилась необходимость переключиться с китайского на английский язык, не спешите менять языковую раскладку. Просто нажмите на клавишу «Shift » и китайский язык в Google pinyin IME изменится на английский. Чтобы с английского языка вернуться на китайский, также нажмите один раз на клавишу «Shift ».

Переключение между упрощенными и традиционными иероглифами

Если вы хотите переключиться с ввода упрощенных иероглифов на ввод традиционных иероглифов, то на панели инструментов Google Pinyin IME найдите иконку в виде шестеренки и нажмите на него левой кнопкой мыши. В появившемся меню, выберите пункт 切换为简体模式 (переключение на упрощенный режим) и нажмите на него. Теперь вы можете набирать текст, используя традиционные китайские иероглифы. Чтобы вернуть на прежнее место упрощенные иероглифы, проделайте ту же процедуру с пунктом 切换为简体模式 .

Кстати, для переключения между традиционными и упрощенными иероглифами, вы можете использовать комбинацию горячих клавиш «Ctrl+Shift+T ».

Ввод звука ü в китайской раскладке

Всем известно, что в китайском языке существует звук ü, который, не так то легко найти на обычной клавиатуре. Его там просто нет. Поэтому с вводом этого звука у многих бывают проблемы.

Все проще, чем кажется.

Достаточно печатать v вместо ü , когда он стоит после L или N .

Пример :

Чтобы напечатать «» (), достаточно набрать «nv ».

Чтобы напечатать «» (绿 ), достаточно набрать «lv ».

Тем не менее, если «ü » стоит после J, Q, X, Y, то при написании можно использовать обычный «u ».

Пример :

Чтобы напечатать (), достаточно набрать «yu ».

Другие возможности Google Pinyin IME

На самом деле, возможностей у этой программы огромное множество и, как вы уже поняли, я коснулся лишь некоторых из них.

Возможно, в будущих статьях, я еще раз вернусь к Google Pinyin IME и более подробно рассмотрю все возможности этой замечательной программы.

Сейчас лишь добавлю, что вы можете самостоятельно настраивать количество иероглифов отображаемых для выбора при вводе, а также выбирать размер иероглифов.

Заключение

Google Pinyin IME можно по праву считать одной из лучших программ для ввода китайских иероглифов. Забудьте про неотесанный Microsoft IME и оставьте его в самых темных уголках своей операционной системы, чтобы он никогда в жизни больше не попадался вам на глаза.

Установив Google Pinyin IME на свой компьютер, вы уже через несколько минут поймете, что вводить китайские иероглифы на компьютере легко и даже весело.

Здравствуйте, уважаемые читатели, почитатели и прочие хорошие люди!

Случалось ли Вам получать и читать письма на “фиг каком пойми языке” или заходить на какой-нибудь интернет-ресурс и вместо привычных букв видеть сплошные кракозябры? Если да, тогда эта заметка для Вас, ибо в ней мы поговорим о кодировке страниц, её форматах, почему оная возникает и как впредь избежать непонятных иероглифов.

Итак, сегодня нас ждет не легкая софтовая статья, а суровая техническая, так что приготовьтесь: будем немного ударяться в суровые реалии.
Поехали.

Что такое кодировка текста и с чем ее едят?

Начать хотелось бы с того, что этой статьи могло бы и не быть, т.к. компьютерно-юзательная жизнь автора этих строк протекала вполне себе спокойно и достойно. Но вот в один прекрасный день, шляясь по просторам сети Интернет не со своего ПК, я столкнулся с непонятными явлениями на некоторых сайтах. Заходя на интернет-ресурсы, я видел не привычный нам русский алфавит и красивый понятный текст, а какую-то ересь в виде непонятной последовательности символов. Выглядела она примерно вот так (см. изображение).

Сначала я подумал, что моя любимая Мозилка (браузер Firefox) перегрелась и ей пора вызывать неотложку, но потом начал понимать, что проблема, скорее всего, на стороне ресурса сети и кроется она в неправильно настроенной кодировке. Это действительно оказалось так, и пошаманив немного с бубном, проблемка была оперативно решена. Результатом же всех моих любовных похождений и стал сегодняшний материал. Собственно, поехали разбираться в деталях.

Всю информацию, представленную в цифровом виде и находящуюся в глобальной паутине, нужно рассматривать с двух сторон: первая - со стороны пользователя (красивый и ухоженный текст на экране монитора) и вторая – со стороны поисковой машины (некий программный код, состоящий из различных тегов/метатегов, таблицы символов и прочее).

Если Вы хоть немного знакомы с языком разметки гипертекста (HTML ), то должны быть в курсе, что сайт глазами поисковых машин (Google, Яндекс ) видится не как обычный текст, а как структурированный документ, состоящий из последовательностей различного рода тегов. Чтобы было понятней, о чем я говорю, давайте взглянем на всеми нами любимый сайт Заметки Сис.Админа ” проекта [Sonikelf"s Project"s ], но не глазами обычного пользователя, а "глазами" поисковика. Для этого нажимаем сочетание клавиш Сtrl+U (для браузеров Firefox и Chrome ) и видим следующую картину (см. изображение):

Перед нами машинный вариант сайт , вот в таком вот непрезентабельном виде он подается поисковым системам и именно в таком виде они его и кушают. Если бы мы просто взяли и “засандалили” варианты статей из блокнота или Word обычным текстом, машины бы им не то что подавились, они бы даже и есть его не стали. Итак, перед нами главная страница проекта в HTML -виде. Обратите внимание на строку с надписью UTF-8 , это не что иное, как пресловутая кодировка текста страницы, именно она и отвечает за формат вывода информации в презентабельном виде, в результате чего через браузер мы видим нормальный текст.

Теперь давайте разберемся, почему же происходит так, что порой на экране монитора мы видим кракозябры. Все очень просто, проблема кроется в открытии файла в неверной кодировке. Если перевести на бытовой язык, то допустим Вас послали в магазин за молоком, а Вы притарабанили хлеб, вроде бы тоже съестное, но совсем другой формат продукта.

Итак, теперь давайте разбираться с теорией и для этого введем некоторые определения.

  1. Кодировка (или “Charset ”) – соответствие набора символов набору числовых значений. Нужна для “сливания” информации в интернет, т.е. текстовая информация преобразуется в биты данных;
  2. Кодовая страница (“Codepage ”) – 1 байтовая (8 бит) кодировка;
  3. Количество значений, принимаемое 1 байтом – 256 (два в восьмой).

Соответствие “символ-изображение” задается с помощью специальных кодовых таблиц, где каждому символу уже присвоен свой конкретный числовой код. Таких таблиц существует достаточно много, и в разных таблицах один и тот же символ может идентифицироваться по-разному (ему могут соответствовать разные числовые коды).

Хотите знать и уметь, больше и сами?

Мы предлагаем Вам обучение по направлениям: компьютеры, программы, администрирование, сервера, сети, сайтостроение, SEO и другое. Узнайте подробности сейчас!

Все кодировки различаются количеством байт и набором специальных знаков, в которые преобразуется каждый символ исходного текста.

Примечание:
Декодирование – операция, в результате которой происходит преобразование кода символа в изображение. В результате этой операции информация выводится на экран монитора пользователя.

В общем.. С определениями разобрались, а теперь давайте узнаем, какие же (кодировки) бывают.

Виды кодировок текста

А их, в общем-то, хватает.

  • ASCII

Одной из самых “древних” считается американская кодировочная таблица (ASCII , читается как “аски”), принятая национальным институтом стандартов. Для кодировки она использовала 7 битов, в первых 128 значениях размещался английский алфавит (в нижнем и верхнем регистрах), а также знаки, цифры и символы. Она больше подходила для англоязычных пользователей и не была универсальной.

  • Кириллица

Отечественный вариант кодировки, для которого стали использовать вторую часть кодовой таблицы – символы с 129 по 256 . Заточена под русскоязычную аудиторию.

  • Кодировки семейства MS Windows : Windows 1250-1258 .

8-битные кодировки, появились как следствие разработки самой популярной операционной системы, Windows . Номера с 1250 по 1258 указывают на язык, под который они заточены, например, 1250 – для языков центральной Европы; 1251 – кириллический алфавит.

  • Код обмена информацией 8 бит – КОИ8

KOI8-R, KOI8-U, KOI-7 – стандарт для русской кириллицы в юникс-подобных операционных системах.

  • Юникод (Unicode )

Универсальный стандарт кодирования символов, позволяющий описать знаки практически всех письменных языков. Обозначение “U+xxxx ” (хххх – 16-ричные цифры). Самые распространенные семейства кодировок UTF (Unicode Transformation Format) : UTF-8, 16, 32 .

В настоящее время, как говорится, “рулит” UTF-8 – именно она обеспечивают наилучшую совместимость со старыми ОС , которые использовали 8 -битные символы. В UTF-8 кодировке находятся большинство сайтов в сети Интернет и именно этот стандарт является универсальным (поддержка кириллицы и латиницы).

Разумеется, я привел не все виды кодировок, а только наиболее ходовые. Если же Вы хотите для общего развития знать их все, то полный список можно отыскать в самом браузере. Для этого достаточно пройти в нем на вкладку “Вид-Кодировка-Выбрать список ” и ознакомиться со всевозможными их вариантами (см. изображение).

Думаю возник резонный вопрос: “Какого лешего столько кодировок? ”. Их изобилие и причины возникновения можно сравнить с таким явлением, как кроссбраузерность/кроссплатформенность. Это когда один и тот же сайт сайт отображается по-разному в различных интернет-обозревателях и на различных гаджет-устройствах. Кстати у сайта "Заметки Сис.Админа " с этим, как Вы заметили всё в порядке:).

Все эти кодировки – рабочие варианты, созданные разработчиками “под себя” и решение своих задач. Когда же их количество перевалило за все разумные пределы, а в поисковиках стали плодиться запросы типа: “Как убрать кракозябры в браузере? ” - разработчики стали ломать голову над приведением всей этой каши к единому стандарту, чтобы, так сказать, всем было хорошо. И кодировка Unicode , в общем-то, это “хорошо” и сделала. Теперь если такие проблемы и возникают, то они носят локальный характер, и не знают как их исправить только совсем непросвещенные пользователи (впрочем, часто беда с кодировкой и отображением сайтов появляется из-за того, что веб-мастер указал на стороне сервера некорректный формат, и приходится переключать кодировку в браузере).

Ну вот, собственно, пока вся "базово необходимая" теория, которая позволит Вам “не плавать” в кодировочных вопросах, теперь переходим к практической части статьи.

Решаем проблемы с кодировкой или как убрать кракозябры?

Итак, наша статья была бы неполной, если бы мы не затронули пользовательско-бытовые вопросы. Давайте их и рассмотрим и начнем с того, как (с помощью чего) можно посмотреть кодировку?

В любой операционной системе имеется таблица символов, ее не нужно докачивать, устанавливать – это данность свыше, которая располагается по адресу: “Пуск-программы-стандартные-служебные-таблица символов”. Это таблица векторных форм всех установленных в Вашей операционной системе шрифтов.

Выбрав “дополнительные параметры” (набор Unicode ) и соответствующий тип начертания шрифта, Вы увидите полный набор символов, в него входящих. Кликнув по любому символу, Вы увидите его код в формате UTF-16 , состоящий из 4 -х шестнадцатеричных цифр (см. изображение).

Теперь пара слов о том, как убрать кракозябры. Они могут возникать в двух случаях:

  1. Со стороны пользователя - при чтении информации в интернет (например, при заходе на сайт);
  2. Или, как говорилось чуть выше, со стороны веб-мастера (например, при создании/редактировании текстовых файлов с поддержкой синтаксиса языков программирования в программе ++ или из-за указания неправильной кодировки в коде сайта).

Рассмотрим оба варианта.

№1. Иероглифы со стороны пользователя.
Допустим, Вы запустили ОС и в каком-то из приложений у Вас отображаются пресловутые каракули. Чтобы это исправить, идем по адресу: “Пуск - Панель управления - Язык и региональные стандарты - Изменение языка ” и выбираем из списка, "Россия ".

Также проверьте во всех вкладках, чтобы локализация была “Россия/русский ” – это так называемая системная локаль.

Если Вы открыли сайт и вдруг поняли, что почитать информацию Вам не дают иероглифы, тогда стоит поменять кодировку средствами браузера (“Вид - Кодировка ”). На какую? Тут все зависит от вида этих кракозябр. Ориентируйтесь на следующую шпаргалку (см. изображение).

№2. Иероглифы со стороны веб-мастера.
Очень часто начинающие разработчики сайтов не придают большого значения кодировке создаваемого документа, в результате чего потом и сталкиваются с вышеозначенной проблемой. Вот несколько простых базовых советов для веб-мастеров, чтобы исправить беду.

Чтобы такого не происходило, заходим в редактор Notepad++ и выбираем в меню пункт “Кодировки ”. Именно он поможет преобразовать имеющийся документ. Спрашивается, какой? Чаще всего (если сайт на WordPress или Joomla ), то “Преобразовать в UTF-8 без BOM ” (см. изображение).

Сделав такое преобразование, Вы увидите изменения в строке статуса программы.

Также во избежание кракозябр необходимо принудительно прописать информацию о кодировке в шапке сайта. Тем самым Вы укажите браузеру на то, что сайт стоит считывать именно в прописанной кодировке. Начинающему веб-мастеру необходимо понимать, что чехарда с кодировкой чаще всего возникает из-за несоответствия настроек сервера настройкам сайта, т.е. на сервере в базе данных прописана одна кодировка, а сайт отдает страницы в браузер в совершенной другой.

Для этого необходимо прописать “внаглую” (в шапку сайта, т.е, как частенько, в файл header.php ) между тегами <head> </head> следующую строчку:

Прописав такую строчку, Вы заставите браузер правильно интерпретировать кодировку, и иероглифы пропадут.

Также может потребоваться корректировка вывода данных из БД (MySQL). Делается сие так:

mysql_query("SET NAMES utf8");
myqsl_query("SET CHARACTER SET utf8");
mysql_query("SET COLLATION_CONNECTION="utf8_general_ci"" ");

Как вариант, можно еще сделать ход конём и прописать в файл .htaccess такие вот строчки:

# BEGIN UTF8
AddDefaultCharset utf-8
AddCharset utf-8 *

CharsetSourceEnc utf-8
CharsetDefault utf-8

# END UTF8

Все вышеприведенные методы (или некоторые из них), скорее всего, помогут Вам и Вашим будущим посетителям избавиться от ненавистных иероглифов и проблем с кодировкой. К сожалению, более подробно мы здесь инструкцию по веб-мастерским штукам рассматривать не будем, думаю, что они обязательно разберутся в подробностях при желании (как-никак у нас несколько другая тематика сайта).

Ну, вот и практическая часть статьи закончена, осталось подвести небольшие итоги.

Послесловие

Сегодня мы познакомились с таким понятием, как кодировка текста. Уверен, теперь при возникновении каракулей на мониторе компьютера Вы не спасуете, а вспомните все приведенные здесь методы и решите вопрос в свою пользу!

На сим все, спасибо за внимание и до новых встреч.

Похожие статьи