19.02.2015, 13:36
nazwa i wersja skryptu, z którego migrowano: IPBoard 3.4.4
wersja skryptu MyBB: MyBB 1.8.3
Też mam podobny problem jak przedstawia tutaj ; generalnie są krzaki po migracji. Tabele w obu bazach (IPB i MyBB) mają kodowanie utf8_general_ci. Zauważyłem, że IPB jakoś dziwnie przechowuje/koduje znaki, niby UTF8 ale nie do końca. Jakby stosowali jeszcze swoje dodatkowe kodowanie? Podaje przykład: utworzyłem sobie w IPB forum o nazwie "Giełda". W bazie danych blob tego tekstu jest jednak zakodowany następująco:
47 69 65 c3 85 e2 80 9a 64 61
G i e ł d a
gdzie te pięć znaków (c3 85 e2 80 9a) to prawdopodobnie zakodowana litera "ł".
W bazie danych oczywiście widać "krzaki" bo niby UTF8 ale nie do końca. Jak w bazie danych dokonam aktualizacji ręcznej (poprzez zapytanie SQL) to słowo "Giełda" jest zakodowane następująco:
47 69 65 c5 82 64 61
G i e ł d a
I tu już wszystko ładnie wygląda (w bazie danych przynajmniej) bo "c5 82" to kod litery "ł" (kodowanie polskich znaków).
Jest jakiś sposób na to? Może skrypt migracyjny MyBB mógłby zamieniać takie coś "w locie"?
Tu jeszcze na szybko podaję jak IPB koduje znaki:
Ą c3 84 e2 80 9e
ą c3 84 e2 80 a6
Ć c3 84 e2 80 a0
ć c3 84 e2 80 a1
Ę c3 84 cb 9c
ę c3 84 e2 84 a2
Ł c3 85 c2 81
ł c3 85 e2 80 9a
Ń c3 85 c6 92
ń c3 85 e2 80 9e
Ś c3 85 c5 a1
ś c3 85 e2 80 ba
Ó c3 83 e2 80 9c
ó c3 83 c2 b3
Ż c3 85 c2 bb
ż c3 85 c2 bc
Ź c3 85 c2 b9
ź c3 85 c2
wersja skryptu MyBB: MyBB 1.8.3
Też mam podobny problem jak przedstawia tutaj
47 69 65 c3 85 e2 80 9a 64 61
G i e ł d a
gdzie te pięć znaków (c3 85 e2 80 9a) to prawdopodobnie zakodowana litera "ł".
W bazie danych oczywiście widać "krzaki" bo niby UTF8 ale nie do końca. Jak w bazie danych dokonam aktualizacji ręcznej (poprzez zapytanie SQL) to słowo "Giełda" jest zakodowane następująco:
47 69 65 c5 82 64 61
G i e ł d a
I tu już wszystko ładnie wygląda (w bazie danych przynajmniej) bo "c5 82" to kod litery "ł" (kodowanie polskich znaków).
Jest jakiś sposób na to? Może skrypt migracyjny MyBB mógłby zamieniać takie coś "w locie"?
Tu jeszcze na szybko podaję jak IPB koduje znaki:
Ą c3 84 e2 80 9e
ą c3 84 e2 80 a6
Ć c3 84 e2 80 a0
ć c3 84 e2 80 a1
Ę c3 84 cb 9c
ę c3 84 e2 84 a2
Ł c3 85 c2 81
ł c3 85 e2 80 9a
Ń c3 85 c6 92
ń c3 85 e2 80 9e
Ś c3 85 c5 a1
ś c3 85 e2 80 ba
Ó c3 83 e2 80 9c
ó c3 83 c2 b3
Ż c3 85 c2 bb
ż c3 85 c2 bc
Ź c3 85 c2 b9
ź c3 85 c2