TS-Doctor 3.0 www.cypheros.de

Autor Thema: Demuxter SUP-Stream via OCR zu SRT  (Gelesen 10351 mal)

Christian

  • Full Member
  • ***
  • Beiträge: 138
  • DVB-S User
Demuxter SUP-Stream via OCR zu SRT
« am: Oktober 29, 2015, 11:15:17 »
Ich habe DVB-S2-Streams die beinhalten nur "grafische" Untertitel. (kein Videotext) Ich brauche diese Untertitel aber unbedingt im Textformat (SRT).
Der TS-Doctor demuxt den Stream zu einem SUP-File. Mit Subtitle Edit kann ich die SUP-Datei laden aber die Timecodes sind falsch. Weil S.E. BluRay-Sups erwartet. Habt ihr ne Idee welches Programm die DVB-SUPs frisst und ein OCR durchlaufen lassen kann?

ErichV

  • Hero Member
  • *****
  • Beiträge: 1212
  • Der Österreicher
Re: Demuxter SUP-Stream via OCR zu SRT
« Antwort #1 am: Oktober 29, 2015, 15:03:10 »
Dieses Feature ist in Planung und könnte eventuell in naher Zukunft bald zur Verfügung stehen.  ;)
1 x Humax ESD-160S, 1x TechniSat TechniBox S4, 2x TechniSat Skystar USB 2 HD CI, Nvidia Shield TV Media Streaming Player, TS Doctor 3.1.13, DVBViewer Pro 7.1.0.0 mit DVBViewer Media Server 3.1.0.0

Derrick

  • Hero Member
  • *****
  • Beiträge: 636
Re: Demuxter SUP-Stream via OCR zu SRT
« Antwort #2 am: Oktober 29, 2015, 16:59:26 »
Zitat
Habt ihr ne Idee welches Programm die DVB-SUPs frisst und ein OCR durchlaufen lassen kann?
Dafür brauchst du nicht zu warten. SubtitleEdit kann doch die SUPs mit OCR verarbeiten, wobei die Qualität nicht immer ausreicht. Du kannst aber alles inkl. timing editieren und als *srt oder andere Formate speichern. Ich wusste gar nicht, dass das Expertentool TS Demuxer auch die SUPs erstellt. Bisher hatte ich dafür PJ.X genommen :)

Derrick

  • Hero Member
  • *****
  • Beiträge: 636
Re: Demuxter SUP-Stream via OCR zu SRT
« Antwort #3 am: Oktober 29, 2015, 17:13:14 »
Zitat
Ich wusste gar nicht, dass das Expertentool TS Demuxer auch die SUPs erstellt. Bisher hatte ich dafür PJ.X genommen

..war auch besser so, denn der TS Demuxer vom TSDOC produziert Timing Müll  >:(

Hier noch mal ein shot von der selben Aufnahme aber mit sup von ProjectX.


Christian

  • Full Member
  • ***
  • Beiträge: 138
  • DVB-S User
Re: Demuxter SUP-Stream via OCR zu SRT
« Antwort #4 am: Oktober 29, 2015, 17:15:44 »
Ja, die Timecodes sind Mist. Da es sich bei mir aber um eine h264-Aufnahme handelt, geht Pj.x nicht.

Derrick

  • Hero Member
  • *****
  • Beiträge: 636
Re: Demuxter SUP-Stream via OCR zu SRT
« Antwort #5 am: Oktober 29, 2015, 17:27:41 »
..auch bei H.264-Aufnahmen lassen sich die SUPs durch Pj.x extrahieren. Einfach bei der Ausgabe video abwählen und die Fehlermeldungen ignorieren :D

BBC über 27,5W hat ja nur DVB-Subtiles und keinen Teletext ;)

Christian

  • Full Member
  • ***
  • Beiträge: 138
  • DVB-S User
Re: Demuxter SUP-Stream via OCR zu SRT
« Antwort #6 am: Oktober 29, 2015, 17:44:28 »
Ich kriegs leider nicht hin.

ProjectX extrahiert keine Uts.

https://www.dropbox.com/sh/j0stz5u44s6bpz8/AABS95d7BMvWsD7-_jfOEtdKa?dl=0

kriegst du sie aus dem Testfile raus ?
« Letzte Änderung: Oktober 29, 2015, 17:46:06 von Christian »

Mam

  • Hero Member
  • *****
  • Beiträge: 3973
Re: Demuxter SUP-Stream via OCR zu SRT
« Antwort #7 am: Oktober 29, 2015, 17:58:03 »
Ich verstehe Dein Problem irgendwie nicht.
Deine Testdatei lässt sich doch ohne Probleme vom TSDoc einlesen, er extrahiert ja auch ohne zu Murren die Teletext UT ?

(Und wenn Du noch etwas Geduld aufbringst, extrahiert er auch bald die DVB UT...)


Wozu also Project.X und der ganze Aufwand ? ? ?

Christian

  • Full Member
  • ***
  • Beiträge: 138
  • DVB-S User
Re: Demuxter SUP-Stream via OCR zu SRT
« Antwort #8 am: Oktober 29, 2015, 18:01:42 »
Mein Problem ist nicht dieser Beispiel-Stream sondern, dass ich bald Streams bekomme wo kein Teletext vorhanden ist.

Mam

  • Hero Member
  • *****
  • Beiträge: 3973
Re: Demuxter SUP-Stream via OCR zu SRT
« Antwort #9 am: Oktober 29, 2015, 18:04:24 »
Na ja, dann glaub halt ErichV und mir: BLEIB COOL, das Problem erledigt sich bald von alleine...

(siehe meine 2te Beispieldatei, das ist die Umwandlung der SUP UT...)

Christian

  • Full Member
  • ***
  • Beiträge: 138
  • DVB-S User
Re: Demuxter SUP-Stream via OCR zu SRT
« Antwort #10 am: Oktober 29, 2015, 18:11:33 »
OK ich habe jetzt mit PjX demuxt und es klappt!
Danke soweit!

Schön, dass der TSDOC das auch bald anbietet. Aber die Timecodes von deinem zweiten SRT stimmen so gar nicht mit dem überein was PjX mir ausgibt.

Mam

  • Hero Member
  • *****
  • Beiträge: 3973
Re: Demuxter SUP-Stream via OCR zu SRT
« Antwort #11 am: Oktober 29, 2015, 18:18:27 »
Schön, dass der TSDOC das auch bald anbietet. Aber die Timecodes von deinem zweiten SRT stimmen so gar nicht mit dem überein was PjX mir ausgibt.

Man arbeitet noch dran  ;D

Außerdem ist der Timecode bei UT relativ unkritisch, sofern er nicht viele Sekunden in der Zukunft oder Vergangenheit liegt.

Ich persönlich lasse mir die Dinger noch mit einem eigenen Tool umrechnen, dass die Anzeigezeit dehnt, sofern der Text eine gewisse Länge überschreitet. Aber das ist ja Geschmackssache, und kommt auf die individuelle Lesegeschwindigkeit an.

Es gibt ja nun genug Tools, um bei SRTs die Zeitbasis zu manipulieren.

Christian

  • Full Member
  • ***
  • Beiträge: 138
  • DVB-S User
Re: Demuxter SUP-Stream via OCR zu SRT
« Antwort #12 am: Oktober 29, 2015, 18:38:26 »
Ich hoffe eure OCR erkennt dann auch Tschechisch ;)

Mam

  • Hero Member
  • *****
  • Beiträge: 3973
Re: Demuxter SUP-Stream via OCR zu SRT
« Antwort #13 am: Oktober 29, 2015, 18:45:08 »
Ich hoffe eure OCR erkennt dann auch Tschechisch ;)
Ist dieselbe, wie in P.x, also wirst Du schon merken, obs geht (ist übrigens nicht "unsere").

Derrick

  • Hero Member
  • *****
  • Beiträge: 636
Re: Demuxter SUP-Stream via OCR zu SRT
« Antwort #14 am: Oktober 29, 2015, 19:05:11 »
..lass dich nicht ins Bockshorn jagen  8)

Zitat
Außerdem ist der Timecode bei UT relativ unkritisch, sofern er nicht viele Sekunden in der Zukunft oder Vergangenheit liegt.

Die sups, die der TS Demuxer vom TSDoc erzeugt, sind vom timing unbrauchbar, wie mein screen shot oben beweist.

Zitat
Es gibt ja nun genug Tools, um bei SRTs die Zeitbasis zu manipulieren.

Bei dem Müll ist alle Liebesmüh vergebens..

Zitat
OK ich habe jetzt mit PjX demuxt und es klappt!
Danke soweit!

Besser wird es der TSDoc auch nicht können. Natürlich kennt nicht Jeder mehr Pj.x ;)

Dein file hat bei mir auch funktioniert, aber manche programme haben sicher mühe, den als TS zu erkennen, weil anscheinend brutal mitten in einem ts_packet geschnitten wurde. Ein Durchlauf iim TSDoc fixet das aber :)

 


www.cypheros.de