Hallo Zusammen,
ich habe folgenden Fall:
Über eine Online-Quelle beziehe ich ein XML-File. Diese File wurde zu Beginn des Projektes einmalig geparsed und in eine MySQL-Datenbank geschrieben.
Nun möchte ich einen Cron erstellen, der alle X min das File erneut herunterlädt und nach Änderungen sucht (Neue Einträge oder Einträge die geändert wurden).
Ich weiss nicht wo ich anpacken soll. Soll ich es in eine neue Tabelle einfügen und dann MySQL vergleichen, soll ich die XML-Files mit diff o.ä. parsen und das Ergebnis verwerten?
Problem ist, dass die XML aus zirka 20.000 Einträgen à >10 Feldern besteht, da kommt ein bisschen was zusammen, da suche ich natürlich die performanteste Lösung.
Als Plattform steht Debian4.0 zur Verfügung, von mir aus auch gerne PERL, Pyton, PHP Lösungen, die Daten werden dann eh von PHP weiter verarbeitet.
Viele Grüße
Felix
ich habe folgenden Fall:
Über eine Online-Quelle beziehe ich ein XML-File. Diese File wurde zu Beginn des Projektes einmalig geparsed und in eine MySQL-Datenbank geschrieben.
Nun möchte ich einen Cron erstellen, der alle X min das File erneut herunterlädt und nach Änderungen sucht (Neue Einträge oder Einträge die geändert wurden).
Ich weiss nicht wo ich anpacken soll. Soll ich es in eine neue Tabelle einfügen und dann MySQL vergleichen, soll ich die XML-Files mit diff o.ä. parsen und das Ergebnis verwerten?
Problem ist, dass die XML aus zirka 20.000 Einträgen à >10 Feldern besteht, da kommt ein bisschen was zusammen, da suche ich natürlich die performanteste Lösung.
Als Plattform steht Debian4.0 zur Verfügung, von mir aus auch gerne PERL, Pyton, PHP Lösungen, die Daten werden dann eh von PHP weiter verarbeitet.
Viele Grüße
Felix