Moin,
folgendes Problem, heute auf der Arbeit habe ich eine External Table zum Parsen einer Textdatei, die folgendes Format hatte: 2010-11-01 12:12:12,xxxx,1234....
und so weiter. Es gab gleich beim ersten feld ein problem, da ich das feld als date definiert habe und als format "yyyy-mm-dd hh24:mi:ss" und das sind 19 Zeichen
Problem, das in dieser Datei nach jeden Zeichen noch das chr(0) steht und somit das feld dann mindestens doppelt so lang ist.
die frage liegt das an der codierung der datei? normaler weise sollte diese in iso-8859-1 codiert sein.
oder könnte die datei beim upload kaputt gegangen sein? woher kommen die Zeichen überhaupt? habe die kleine datei dann im utf-8 format abgespeichert und das wurde dann ohne probleme üebrnohmen.
leider sind die meisten dateien über 200 mb, die nicht so einfach neu abgespeichert werden können.
wenn es ein charset problem ist, müsste es ja mit CHARACTERSET '' behoben sein, habe aber iso-8859-1 ausprobiert und hat nicht geholfen.
hat sich jemand schon mal mit ähnlichen problem beschäftigt?
folgendes Problem, heute auf der Arbeit habe ich eine External Table zum Parsen einer Textdatei, die folgendes Format hatte: 2010-11-01 12:12:12,xxxx,1234....
und so weiter. Es gab gleich beim ersten feld ein problem, da ich das feld als date definiert habe und als format "yyyy-mm-dd hh24:mi:ss" und das sind 19 Zeichen
Problem, das in dieser Datei nach jeden Zeichen noch das chr(0) steht und somit das feld dann mindestens doppelt so lang ist.
die frage liegt das an der codierung der datei? normaler weise sollte diese in iso-8859-1 codiert sein.
oder könnte die datei beim upload kaputt gegangen sein? woher kommen die Zeichen überhaupt? habe die kleine datei dann im utf-8 format abgespeichert und das wurde dann ohne probleme üebrnohmen.
leider sind die meisten dateien über 200 mb, die nicht so einfach neu abgespeichert werden können.
wenn es ein charset problem ist, müsste es ja mit CHARACTERSET '' behoben sein, habe aber iso-8859-1 ausprobiert und hat nicht geholfen.
hat sich jemand schon mal mit ähnlichen problem beschäftigt?
MfG ShureG
There are 10 kinds of people. Those who understand binary notation, and those who do not.
There are 10 kinds of people. Those who understand binary notation, and those who do not.