Перейти к контенту

Как правильно подобрать кодировку базы?


Рекомендуемые сообщения

Как правильно подобрать кодировку базы? Есть дамп базы данных в некой кодировке (у заказчика есть только текстовый .sql дамп). Каким образом определить правильную систему его декодирования и преобразовать в читаемый UTF8 ?

p.s. Собственные эксперименты пока ничего не дали.

Пример части дампа прикреплен

 

Буду признателен за любой совет.

sample_mysql_dump.txt

Ссылка на комментарий
Поделиться на других сайтах

CP1252 под видом latin1. Сделать utf-8 из него можно в три комманды:

 

iconv -f cp1252 -t utf8 dump.sql > dump.utf8
sed 's/SET NAMES latin1/SET NAMES utf8/g' < dump.utf8 > 1.dump.utf8
sed 's/DEFAULT CHARSET=latin1/DEFAULT CHARSET=utf8/g' < 1.dump.utf8 > dump.utf8.sql

Ссылка на комментарий
Поделиться на других сайтах

Более правильный синтаксис при котором проходит конвертирование

iconv -c -f cp1252 -t utf-8 dump.sql > dump.utf8

 

-c добавлено чтобы не спотыкался конвертор, но не получается все равно - получается абракадабра, наверное это все-таки не 1252. Уважаемый Ritsuka, сможете ли помочь с конвертацией в читаемый формат, если предоставлю дамп - он всего 300кб ?

Ссылка на комментарий
Поделиться на других сайтах

Присоединиться к обсуждению

Вы можете ответить сейчас, а зарегистрироваться позже. Если у вас уже есть аккаунт, войдите, чтобы ответить от своего имени.

Гость
Ответить в этой теме...

×   Вы вставили отформатированный текст.   Удалить форматирование

  Допустимо не более 75 смайлов.

×   Ваша ссылка была автоматически заменена на медиа-контент.   Отображать как ссылку

×   Ваши публикации восстановлены.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.

Зарузка...
×
×
  • Создать...

Важная информация

Находясь на нашем сайте, вы соглашаетесь на использование файлов cookie, а также с нашим положением о конфиденциальности Политика конфиденциальности и пользовательским соглашением Условия использования.