Перейти к контенту

Перевод в IPB в двух экземплярах


Рекомендуемые сообщения

В виду растущей популярности utf-8 (на него постепенно переходят большинство популярных веб движков и проектов) почему бы перевод следующей версии IPB 2.1.4 не сделать в двух вариантах.

 

В win1251 кодировке и в utf-8 кодировке.

Ссылка на комментарий
Поделиться на других сайтах

Kuja - знаеш был у меня движок на utf более большего гемора не ожидал, проктически у всех кто из россии проблемы.. так что не надо =)
Ссылка на комментарий
Поделиться на других сайтах

А что сложного?

 

Берём конвектор, коих в инете полным полно и конверкаем файлы, потом фиксим баги :D)

Ссылка на комментарий
Поделиться на других сайтах

на него постепенно переходят большинство популярных веб движков и проектов

Нерусских небусь? Смысл то каков сего, чем windows-1251 то не устраивает?

Ссылка на комментарий
Поделиться на других сайтах

А что сложного?

Берём конвектор, коих в инете полным полно и конверкаем файлы, потом фиксим баги

 

Потому, что если уже файл с русским текстом конвертировать в UTF8, то весь русский текст становится квадратиками. Все нужно заного набивать.

 

Нерусских небусь? Смысл то каков сего, чем windows-1251 то не устраивает?

Ты когда нибудь посещал китайский или корейский форум без установленных при этом на XP этих самых корейских кодировок? Что ты там увидешь? Квадратики или абракадабру.

Мне нужно, чтобы иностранный посетитель у которого нет стоит русская кодировка win1251 мог без проблем читать форум.

Также например человек зашел в интернет из интернет кафе. А там винда без русской кодировки. Не прочитать не поадминить.

А UTF8 отображается на любых операционках и в любых странах корректно.

 

был у меня движок на utf более большего гемора не ожидал, проктически у всех кто из россии проблемы

Никаких проблем. Нет. Просто нужно MySQL 4.1 установленный в кодировке utf8.

Уже два блог движка юзаю с utf8. Удобно. Проблем вообще никаких. На русском все прекрасно отображается.

Ссылка на комментарий
Поделиться на других сайтах

Kuja - если Вы взяли плохой конвектор, это совершенна не моя проблема.

 

Мой конвектор файлы не каверкает. Давай задумаемся, в чём смысл конвертации? Дописать пару байтов (в ASCII это символы "яю", причём я сначало написал и удивлялся как клёва, а потом (года через два) понял почему). Нет, смысл конвертации в том, чтобы ASCII коды символов заменить на UTF коды.

Ссылка на комментарий
Поделиться на других сайтах

на него постепенно переходят большинство популярных веб движков и проектов

Нерусских небусь? Смысл то каков сего, чем windows-1251 то не устраивает?

Моя CMS тоже в utf8 будет, например :D Т.к. там будет база данных World of Warcraft, а она в utf8.

 

Потому, что если уже файл с русским текстом конвертировать в UTF8, то весь русский текст становится квадратиками. Все нужно заного набивать.

Плохой конвертер

 

А что за конвертор у тебя?

EditPlus 2 и AkelPad (если из TotalCommander)

Ссылка на комментарий
Поделиться на других сайтах

У меня EmEditor - попробуй в Edit Plus открыть образ DVD 5ГБ и в EmEditor - почувствуешь разницу :D)

А в EmEditor есть подсветка lua синтаксиса? Мне это намного важнее чем открытие 5Гб файла ;)

P.S. и разницу не почувствуешь, т.к. Edit Plus не открывает файлы рамером больше четверти оперативки

Ссылка на комментарий
Поделиться на других сайтах

Сабжевая проблема высосана из пальца. Надо - конвертируйте.

При чём тут переводчики? Главное, чтобы перевод вообще был, а перегнать все файлы в другую кодировку труда не составляет.

Давайте сейчас ещё koi8-r просить будем.

Ссылка на комментарий
Поделиться на других сайтах

  • 4 недели спустя...

Объясните, плиз, новичку ИПБ, в чём состоит суть конвертации под utf8? Нужно переколбасить что именно базу и файлы из /cashe/lang_cash?

Так? Или что-то ещё? Можно ли это сделать для уже установленного форума?

Ссылка на комментарий
Поделиться на других сайтах

При этом надо учесть, что при использование UTF-8 на каждый символ записывается не один байт, а два - таблица символов и символ. Таким образом, получается, что через UTF-8 можно без проблем записать сразу 256^2 символов... то-то же -)

 

Минус - я уже сказал, текст весит вдвое больше. Раз весит вдвое больше - надо аккуратненько поправить ограничения на длину сабжей, etc.

Ссылка на комментарий
Поделиться на других сайтах

При этом надо учесть, что при использование UTF-8 на каждый символ записывается не один байт, а два - таблица символов и символ. Таким образом, получается, что через UTF-8 можно без проблем записать сразу 256^2 символов... то-то же -)

Utf-8 тем и хорош, что два байта он использует только для символов, код которых больше 128. А таких довольно таки немного. Конечно, для русских символов - это будет ощущаться, но в наше время дешевизны памяти винчестеров - это пыль.

 

Минус - я уже сказал, текст весит вдвое больше. Раз весит вдвое больше - надо аккуратненько поправить ограничения на длину сабжей, etc.
в php есть функции utf-decode(encode), которые учитывают "двухбайтность". Правда в нынешнем релизе такие функции возможно и незаюзаны... Поэтому длину корректировать не нужно, возможно нужно только вызывать эти функции в нужных местах.

 

А что по сути моего вопроса?

Ссылка на комментарий
Поделиться на других сайтах

Ну, а по сути - Вы всё верно говорите..

 

Даже lang_cache верно пишите.

 

Я сказал по-сути, не верите - сделайте не учитывая длинну сабжа, увидите проблемы.

 

Это всё. Можно и для установленного - конвертируйте БД, для полной утфности.

Ссылка на комментарий
Поделиться на других сайтах

небольшая поправка: utf-8 использует символы длиной 1-3 байта.

 

Объясните, плиз, новичку ИПБ, в чём состоит суть конвертации под utf8?

Многоязычность.

Нужно переколбасить что именно базу и файлы из /cashe/lang_cash?

Так? Или что-то ещё?

Еще файлы админки (если она русская). Не забудь так же кодировку соединения с базой utf поставить. (SET names utf8)

Можно ли это сделать для уже установленного форума?

да

Ссылка на комментарий
Поделиться на других сайтах

Это из-за того, что у хостера win1251 стоит на MySQL.

 

Все типи соединения с БД надо выставить в UTF8, а сами таблицы в win1251.

Мне помогло.

 

 

А где менять допустимую длину сообщений, других полей и т.д.

И вообще. Может какой мануал создать? Где все по пунктам расписать, как перевести форум в utf8.

Ссылка на комментарий
Поделиться на других сайтах

""Все типи соединения с БД надо выставить в UTF8, а сами таблицы в win1251.""

Если выставить таблицы в windowd-1251, то как же тогда в них хранить utf-ные символы? Понту тогда переводить на utf?

 

И скажи, плиз, где можно выставить тип соединения с БД?

Ссылка на комментарий
Поделиться на других сайтах

Если выставить таблицы в windowd-1251, то как же тогда в них хранить utf-ные символы? Понту тогда переводить на utf?

Обычно. Записываться они будут в utf8 как надо.

 

Сравнение таблиц надо выставить в cp1251_general_ci (если выставить utf8, то "ш" и "И" так и будут квадратиками)

Сопоставление соединения с MySQL - в utf8_general_ci

 

 

И скажи, плиз, где можно выставить тип соединения с БД?

\ips_kernel\class_db_mysql.php

Тут на форуме про это тема была. Только там пытались выставить cp1251.

Ссылка на комментарий
Поделиться на других сайтах

Обычно. Записываться они будут в utf8 как надо.

Нет, тогда они буду конвертиться в cp1251 и записываться. А при чтении они будут читаться и конвертиться в utf8. Какой тогда в этом смысл?

Ссылка на комментарий
Поделиться на других сайтах

Нет, тогда они буду конвертиться в cp1251 и записываться. А при чтении они будут читаться и конвертиться в utf8. Какой тогда в этом смысл?

А смысл в том, что у хостера данные в БД хранятся и пишутся в cp1251 (character_set_server cp1251 и init_connect SET NAMES cp1251). И не будет он эти настройки на utf8 менять. Не колокейшен.

 

И если таблицы в utf8 держать, то там абракадабра будет. И буквы "ш" и "И" будут на сайте или форуме квадратиками.

Я уже на эти грабли наступал. Выставил как все написано выше. Все работает корректно.

Ссылка на комментарий
Поделиться на других сайтах

То есть мне теперь надо переустанвливать форум и устанавливать его в базу данных с кодировкой cp1251, изменить этот файл и всё будет нормально?
Ссылка на комментарий
Поделиться на других сайтах

Нет, тогда они буду конвертиться в cp1251 и записываться. А при чтении они будут читаться и конвертиться в utf8. Какой тогда в этом смысл?

А смысл в том, что у хостера данные в БД хранятся и пишутся в cp1251 (character_set_server cp1251 и init_connect SET NAMES cp1251). И не будет он эти настройки на utf8 менять. Не колокейшен.

 

И если таблицы в utf8 держать, то там абракадабра будет. И буквы "ш" и "И" будут на сайте или форуме квадратиками.

Я уже на эти грабли наступал. Выставил как все написано выше. Все работает корректно.

Если ты смог поставить соединение в utf8, то какие проблемы перевести таблицы в utf8? Я где-то тут даже выкладывал свой скрипт для этого.

 

У хостера просто по умолчанию cp1251 для таблиц. А раз есть возможность сделать соединение utf8, то есть возможность и сделать таблицы utf8.

Ссылка на комментарий
Поделиться на других сайтах

профф

Я ставил два блог движка в utf8 кодировке с нуля. Таблицы выставил в сравнение utf8.

Все ради следственного эксперимента.

 

Буквы "ш" и "И" у меня были квадратиками.

 

Как только я выставил сравнение таблиц в cp1251_general_ci все стало отображаться нормально.

Зуб даю.

Ссылка на комментарий
Поделиться на других сайтах

×
×
  • Создать...

Важная информация

Находясь на нашем сайте, вы соглашаетесь на использование файлов cookie, а также с нашим положением о конфиденциальности Политика конфиденциальности и пользовательским соглашением Условия использования.