Demuxter SUP-Stream via OCR zu SRT

Begonnen von Christian, Oktober 29, 2015, 11:15:17

« vorheriges - nächstes »

Christian

Ich habe DVB-S2-Streams die beinhalten nur "grafische" Untertitel. (kein Videotext) Ich brauche diese Untertitel aber unbedingt im Textformat (SRT).
Der TS-Doctor demuxt den Stream zu einem SUP-File. Mit Subtitle Edit kann ich die SUP-Datei laden aber die Timecodes sind falsch. Weil S.E. BluRay-Sups erwartet. Habt ihr ne Idee welches Programm die DVB-SUPs frisst und ein OCR durchlaufen lassen kann?
mein Kanal rund um das Thema "Tschechische Filme und Serien"
https://www.youtube.com/c/ChristianArabellaundco

ErichV

Dieses Feature ist in Planung und könnte eventuell in naher Zukunft bald zur Verfügung stehen.  ;)
1 x Humax ESD-160S, 1x TechniSat TechniBox S4, 2x TechniSat Skystar USB 2 HD CI, Nvidia Shield TV Media Streaming Player, TS Doctor 4.0.35, DVBViewer Pro 7.2.5.0 mit DVBViewer Media Server 3.2.5.0

Derrick

ZitatHabt ihr ne Idee welches Programm die DVB-SUPs frisst und ein OCR durchlaufen lassen kann?
Dafür brauchst du nicht zu warten. SubtitleEdit kann doch die SUPs mit OCR verarbeiten, wobei die Qualität nicht immer ausreicht. Du kannst aber alles inkl. timing editieren und als *srt oder andere Formate speichern. Ich wusste gar nicht, dass das Expertentool TS Demuxer auch die SUPs erstellt. Bisher hatte ich dafür PJ.X genommen :)

Derrick

ZitatIch wusste gar nicht, dass das Expertentool TS Demuxer auch die SUPs erstellt. Bisher hatte ich dafür PJ.X genommen

..war auch besser so, denn der TS Demuxer vom TSDOC produziert Timing Müll  >:(

Hier noch mal ein shot von der selben Aufnahme aber mit sup von ProjectX.


Christian

Ja, die Timecodes sind Mist. Da es sich bei mir aber um eine h264-Aufnahme handelt, geht Pj.x nicht.
mein Kanal rund um das Thema "Tschechische Filme und Serien"
https://www.youtube.com/c/ChristianArabellaundco

Derrick

..auch bei H.264-Aufnahmen lassen sich die SUPs durch Pj.x extrahieren. Einfach bei der Ausgabe video abwählen und die Fehlermeldungen ignorieren :D

BBC über 27,5W hat ja nur DVB-Subtiles und keinen Teletext ;)

Christian

#6
Ich kriegs leider nicht hin.

ProjectX extrahiert keine Uts.

https://www.dropbox.com/sh/j0stz5u44s6bpz8/AABS95d7BMvWsD7-_jfOEtdKa?dl=0

kriegst du sie aus dem Testfile raus ?
mein Kanal rund um das Thema "Tschechische Filme und Serien"
https://www.youtube.com/c/ChristianArabellaundco

Mam

Ich verstehe Dein Problem irgendwie nicht.
Deine Testdatei lässt sich doch ohne Probleme vom TSDoc einlesen, er extrahiert ja auch ohne zu Murren die Teletext UT ?

(Und wenn Du noch etwas Geduld aufbringst, extrahiert er auch bald die DVB UT...)


Wozu also Project.X und der ganze Aufwand ? ? ?

Christian

Mein Problem ist nicht dieser Beispiel-Stream sondern, dass ich bald Streams bekomme wo kein Teletext vorhanden ist.
mein Kanal rund um das Thema "Tschechische Filme und Serien"
https://www.youtube.com/c/ChristianArabellaundco

Mam

Na ja, dann glaub halt ErichV und mir: BLEIB COOL, das Problem erledigt sich bald von alleine...

(siehe meine 2te Beispieldatei, das ist die Umwandlung der SUP UT...)

Christian

OK ich habe jetzt mit PjX demuxt und es klappt!
Danke soweit!

Schön, dass der TSDOC das auch bald anbietet. Aber die Timecodes von deinem zweiten SRT stimmen so gar nicht mit dem überein was PjX mir ausgibt.
mein Kanal rund um das Thema "Tschechische Filme und Serien"
https://www.youtube.com/c/ChristianArabellaundco

Mam

Zitat von: Christian am Oktober 29, 2015, 18:11:33
Schön, dass der TSDOC das auch bald anbietet. Aber die Timecodes von deinem zweiten SRT stimmen so gar nicht mit dem überein was PjX mir ausgibt.

Man arbeitet noch dran  ;D

Außerdem ist der Timecode bei UT relativ unkritisch, sofern er nicht viele Sekunden in der Zukunft oder Vergangenheit liegt.

Ich persönlich lasse mir die Dinger noch mit einem eigenen Tool umrechnen, dass die Anzeigezeit dehnt, sofern der Text eine gewisse Länge überschreitet. Aber das ist ja Geschmackssache, und kommt auf die individuelle Lesegeschwindigkeit an.

Es gibt ja nun genug Tools, um bei SRTs die Zeitbasis zu manipulieren.

Christian

Ich hoffe eure OCR erkennt dann auch Tschechisch ;)
mein Kanal rund um das Thema "Tschechische Filme und Serien"
https://www.youtube.com/c/ChristianArabellaundco

Mam

Zitat von: Christian am Oktober 29, 2015, 18:38:26
Ich hoffe eure OCR erkennt dann auch Tschechisch ;)
Ist dieselbe, wie in P.x, also wirst Du schon merken, obs geht (ist übrigens nicht "unsere").

Derrick

..lass dich nicht ins Bockshorn jagen  8)

ZitatAußerdem ist der Timecode bei UT relativ unkritisch, sofern er nicht viele Sekunden in der Zukunft oder Vergangenheit liegt.

Die sups, die der TS Demuxer vom TSDoc erzeugt, sind vom timing unbrauchbar, wie mein screen shot oben beweist.

ZitatEs gibt ja nun genug Tools, um bei SRTs die Zeitbasis zu manipulieren.

Bei dem Müll ist alle Liebesmüh vergebens..

ZitatOK ich habe jetzt mit PjX demuxt und es klappt!
Danke soweit!

Besser wird es der TSDoc auch nicht können. Natürlich kennt nicht Jeder mehr Pj.x ;)

Dein file hat bei mir auch funktioniert, aber manche programme haben sicher mühe, den als TS zu erkennen, weil anscheinend brutal mitten in einem ts_packet geschnitten wurde. Ein Durchlauf iim TSDoc fixet das aber :)


www.cypheros.de