Webboard

Pełna wersja: Krzaki zamiast polskich znaków po konwersji
Aktualnie przeglądasz uproszczoną wersję forum. Kliknij tutaj, by zobaczyć wersję z pełnym formatowaniem.
nazwa i wersja skryptu, z którego migrowano: IPBoard 3.4.4
wersja skryptu MyBB: MyBB 1.8.3


Też mam podobny problem jak przedstawia tutaj ; generalnie są krzaki po migracji. Tabele w obu bazach (IPB i MyBB) mają kodowanie utf8_general_ci. Zauważyłem, że IPB jakoś dziwnie przechowuje/koduje znaki, niby UTF8 ale nie do końca. Jakby stosowali jeszcze swoje dodatkowe kodowanie? Podaje przykład: utworzyłem sobie w IPB forum o nazwie "Giełda". W bazie danych blob tego tekstu jest jednak zakodowany następująco:

47 69 65 c3 85 e2 80 9a 64 61
G i e ł d a

gdzie te pięć znaków (c3 85 e2 80 9a) to prawdopodobnie zakodowana litera "ł".


W bazie danych oczywiście widać "krzaki" bo niby UTF8 ale nie do końca. Jak w bazie danych dokonam aktualizacji ręcznej (poprzez zapytanie SQL) to słowo "Giełda" jest zakodowane następująco:

47 69 65 c5 82 64 61
G i e ł d a

I tu już wszystko ładnie wygląda (w bazie danych przynajmniej) bo "c5 82" to kod litery "ł" (kodowanie polskich znaków).

Jest jakiś sposób na to? Może skrypt migracyjny MyBB mógłby zamieniać takie coś "w locie"?


Tu jeszcze na szybko podaję jak IPB koduje znaki:
Ą c3 84 e2 80 9e
ą c3 84 e2 80 a6
Ć c3 84 e2 80 a0
ć c3 84 e2 80 a1
Ę c3 84 cb 9c
ę c3 84 e2 84 a2
Ł c3 85 c2 81
ł c3 85 e2 80 9a
Ń c3 85 c6 92
ń c3 85 e2 80 9e
Ś c3 85 c5 a1
ś c3 85 e2 80 ba
Ó c3 83 e2 80 9c
ó c3 83 c2 b3
Ż c3 85 c2 bb
ż c3 85 c2 bc
Ź c3 85 c2 b9
ź c3 85 c2