"Christmas - the time to fix the computers of your loved ones" « Lord Wyrm

konvertieren von zeichen in utf8 encoding

maexchen 05.03.2004 - 14:06 758 3
Posts

maexchen

Little Overclocker
Registered: Sep 2000
Location: vienna
Posts: 56
Servus!

Ich bräuchte Hilfe beim konvertieren von sonderzeichen und umlauten aus anderen sprachen(Slowakisch, Polnisch, etc.) in die entsprechenden utf8 codierung für html.

Alle Zeichen sind im "Latin Extended-A" Zeichen Tabelle drinnen.

Zum Beispiel soll:
Zitat
š > &_#x0161; (ohne underscore)
ť > &_#x0165; (ohne underscore)
in die entsprechenden Htmlcodes für Utf 8 Charset umgewandelt werden.

Kennt jemand ein Programm oder Script (am besten PHP oder Perl), dass dies machen kann?

Danke im voraus,

cu
maexchen

atrox

in fairy dust... I trust!
Avatar
Registered: Sep 2002
Location: HTTP/1.1 404
Posts: 2782
bei solchen umwandlungen mußt halt immer auch wissen woher du umwandelst. welche codepage hat die quelle ?

falls du formular-daten verwendest, dann laß dir doch die form-daten auch gleich als utf-8 schicken.

maexchen

Little Overclocker
Registered: Sep 2000
Location: vienna
Posts: 56
hi atrox!

die texte, die ich bekommen habe, sind in einem word file drinnen bzw. in einer mail und sollen auf eine html seite.
slowakisch hat die codepage "windows-1250" und polnisch "ISO-8859-2".

ich habe mir ein php script geschrieben, dass die texte aus einem eingabe formular ausliest und es umwandeln soll. aber das script funktioniert nicht so ganz.

leider konnte ich deinen 2.ten vorschlag von dir nicht testen, da ich nicht weiss wie man die formdaten direkt ins utf-8 format verschickt.
falls du aber die konvertierung in die utf-8 zeichen meinst, die man auch mit der php function utf8_encode bekommt (zb: ľ für ľ ) dann nützt es mir leider auch nichts. da ich den entsprechenden htmlcode (&_#x0165; ohne underscore)benötige.

cu
maexchen

watchout

Legend
undead
Avatar
Registered: Nov 2000
Location: Off the grid.
Posts: 6845
warum brauchst du denn eigentlich den html-code? wenn du das charset richtig definierst solltest du auch kein problem mit den sonderzeichen haben

also, sag mal lieber was du damit bezwecken willst, vielleicht gibts ja eine viel bessere/einfachere lösung ;)
Kontakt | Unser Forum | Über overclockers.at | Impressum | Datenschutz