Feature request: Titelerkennung über OCR oder CSV Datei

Begonnen von loddoking, April 12, 2018, 07:52:30

« vorheriges - nächstes »

loddoking

Da meine Aufnahmen meist weder Staffelnummer, Folgennummer oder Titel im Dateinamen haben bei Serienaufnahmen behelfe ich mir immer mit fernsehserien.de bei der benennung.
Viele Aunahmen werden von TV Doctor ja auch über die Metadaten bei den Namensvorschlägen ja die richtigen Titel angezeigt schonb während der bearbeitung.

Eine weitere Idee um diesen Prozess zu optimieren wäre ob man nicht die OCR Texterkennung nutzen könnte die bei eingebrannten Untertiteln, eine funktion die ich zugegebenermaßen nie ausprobiert habe, nicht nutzen könnte um die meist nach einem Intro eigeblendeten Titel auszulesen und gegebenenfalls mit dem Titelvorschlag aus den Metadaten abzugleichen.

Eine weitere Idee könnte ich mir vorstellen wäre diesen Titelvorschlag anhand der mittels OCR in der Aufnahme erkannten Titel/Stringketten mit einer csv datei abzugleichen in der sämtliche Titel bereits nach wunsch vorgefertigt drinn stehen.
Sprich: Ich erstelle mir aus einer belibigen Datenquelle eine CSV zb per Excel mit sämtliche Titeln sowie zugehöriger Staffel und Folgennummer einer Serie. Speichere sie zb als "NCIS LA.csv" ab. Wenn ich also eine dutzend aufnahmen von besagter Serie schneiden will lade ich die liste über die optionen einals datenquelle für sämtliche weitere dateien. Wenn nun also das Bildmaterial analysiert wird und über OCR Text erkannt wird, könnten die ergebnisse mit besagter csv abgeglichen werden und bei übereinstimmung sofort der korrekte Dateiname generiert werden.
Oder eben statt über OCR, auch die metadaten mit der CSV abgeglichen.

Wie gesagt manchmal sind die Namensvorschläge sogar richtig die über Metadaten errechnet werden, mittels einer vorgefertigten Liste für Titel könnte man dieses Ergebniss optimieren.

Oder wenigstens eine Option schaffen nach der man während des setzens der Schnittmarken beim zuordnen der Dateinamern der einezelnen Abschnitte im Vorschaufenster im Dropdownmenü eine oder mehrere solcher listen voher einlesen und als namensvorschläge auswählbar wäre. Wäre schonmal hilfreich als dauern per Copy und Paste den Titel über fernsehserien.de zurechtzufummeln.

Mam

mit Verlaub gesagt: die Ideen sind Quatsch  ;D

Warum das Rad nochmal erfinden? Benutz doch einfach vorhandene Datenbanken wie z.B. tvdb.com, da ist so ziemlich jede Episode drin, mit Beschreibung, Screenshots usw. Und die Faulen nehmen dann noch Tools wie z.B. Ember Media Manager, die diese Datenbanken durchsuchen und die Aufnahmen korrekt umbenennen können.

Der Kram (der im Übrigen recht aufwendig wird) gehört nicht in den Doc rein.


loddoking

Dass man sich die Dateinamen selber zusammenstückeln kann aus diversen Datenbanken weiss ich selber. Mach das aber mal ein paar hundert mal...
Es ist ein zwischenschritt der aus mehreren einzelschritten besteht aus raussuchen des richigen eintrages, Copy& Paste und Staffel/ Folgennummer dazutippseln.

Wär beim Schneiden durchaus ne erleichterung dann sofort aus dem Dropdown menü bei der Datei:
Navy CIS_ L_A_ - kabel eins HD - 20180226 0900.ts
Sofort den entgültigen Dateinamen raussuchen könnte?
323 Die Rückkehr des Chamäleons (1).ts

Ich weiss. Für denjenigen der ein, zwei Serienfolgen die Woche aufzeichnet nicht nachvollziehbar. Aber wenn man eine ganze Serie aufnimmt und 30 aufgezeichnete Folgen am Stück bearbeitet sieht die Sache anders aus. Da ist jeder Zwischenschritt der sich optimieren oder automatisieren lässt entscheidend im Workflow.

Mam

Schau mal, hier tummeln sich im Moment über 10000 Episoden diverser Serien rum, und alle haben ein einheitliches Dateimamensformat wie z.B. (siehe Screenshot)

Glaubst Du ernsthaft, ich würde da irgendwas "von Hand" dran machen?

Das geht alles vollautomatisch mit den erwähnten Tools / Datenbanken.




loddoking

#4
Ja, das funktioniert auch alles wunderbar sofern die Dateinamen zumindest Staffel und Folgennummer aufweisen.
In meinem Fall tun sie das nicht.
Und nebenbei, bei Aufnahmem ganzer Blöcke mit mehreren Folgen auf einmal schon gar nicht. Es gibt schlichtweg kein alleinstehendes Tool das das nachträgliche benennen der Datei anhand von Sendezeit und datum ermöglicht.

Aber was solls. Wär bloß ein Wunsch gewesen. Auf die batchbearbeitung ganzer Ordner zur Werbeerkennung wart nicht nur ich immer noch vergeblich. Wär auch so n Ding das einem diese minutenlange warterei ersparen würde während des scanvorgangs insbesondere beim VA-Modus kann da im gesammten paar Stunden zusammenkommen.

Mam

#5
Zitat von: loddoking am April 12, 2018, 11:46:44
Ja, das funktioniert auch alles wunderbar sofern die Dateinamen zumindest Staffel und Folgennummer aufweisen.
In meinem Fall tun sie das nicht.
Und nebenbei, bei Aufnahmem ganzer Blöcke mit mehreren Folgen auf einmal schon gar nicht. Es gibt schlichtweg kein alleinstehendes Tool das das nachträgliche benennen der Datei anhand von Sendezeit und datum ermöglicht.
Dann solltest Du vielleicht daran arbeiten, dass Dein Aufnahmegerät die "richtigen" Dateinamen liefert?
Spaß beiseite, tuen meine manchmal auch nicht.
Aber ich bin dann trotdem faul und nenn sie maximal "1x22" und schmeiss sie in das richtige Verzeichnis für die entsprechende Serie.
Dank eingebauten regulären Ausdrücken kannst Du auch diverse andere Formate nehmen "S01E22" oder sogar "122" reicht auch schon. Und wenn Du wirklich "30 am Stück" hast, nehme ich an, dass die sowieso schon irgendeine Kennung enthalten. Wenn nicht, erstell doch Deine CSV Datei und mach eine Batchumbenennung bevor Du das Tool anwirfst.

Die "richtige" Umbenennung macht dann Ember automatisch.

Man muß nur flexibel sein  ;D Alle Komponenten sind vorhanden und frei verfügbar...



loddoking

ZitatDann solltest Du vielleicht daran arbeiten, dass Dein Aufnahmegerät die "richtigen" Dateinamen liefert?
Spaß beiseite, tuen meine manchmal auch nicht.
Daran scheiterte es auch vor Jahren. Das händische prüfen und nachbearbeiten der richtigen Titel machte mehr arbeit als jetzt. Dann habe ich doch lieber das Format mit Sendezeit und Datum gewählt.

Ember ist soviel ich weiss bestandteil von Kodi. Beides Teile die ich nicht nutze. Zu überfrachtet.
Ich weiss nich ob das Sinn macht ein bewährtes Workflow über den haufen zu werfen und mich mit unnötig überfrachteten Tools herumzuqälen um ein winziges Problem bei der Dateibenennung zu beheben.


Die ursprungsidee war ja die bereits enthaltene OCR Untertitelerkennung im Doc zu nutzen um auch eigeblendete Titel zu erfassen. Wäre technisch aber in der Tat sehr schwer umsetzbar denke ich. Schaon allein deshalb weil besagte Titeleinblendungen von Sendung zu Sendung sowohl Optisch als auch Zeitlich stark variieren.

Mam

Zitat von: loddoking am April 12, 2018, 12:16:14
Ember ist soviel ich weiss bestandteil von Kodi. Beides Teile die ich nicht nutze. Zu überfrachtet.
Nein, es gibt zwar eine Möglichkeit, Kodi automatisch mit zu synchronisieren, aber vordringlich erstellt Ember erstmal nur lokale Dateien (NFO mit Film/Episoden Infos, optional noch Runterladen von Screenshots/Postern/Schauspielerbilder/Trailerns usw) und benennt sie gemäss der Vorgaben und Infos um.

Zitat
Die ursprungsidee war ja die bereits enthaltene OCR Untertitelerkennung im Doc zu nutzen um auch eigeblendete Titel zu erfassen. Wäre technisch aber in der Tat sehr schwer umsetzbar denke ich. Schaon allein deshalb weil besagte Titeleinblendungen von Sendung zu Sendung sowohl Optisch als auch Zeitlich stark variieren.
Dir sollte ja selber klar sein, dass diese Idee von vorneherein zum Scheitern verurteilt ist. Nicht alle Sendungen blenden überhaupt sinnvolle Titel ein, OCR funktioniert nur mit antrainierten Fonts (und jeder Film hat sich früher die Mühe gegeben, einen eigenen Font zu erfinden), usw. usw.

Im besten Falle hast Du hinterher auf der Platte dann "Eilmeldung S01E99 - Lawine begräbt Auto unter sich" ;D

Nein, de fakto gibt es keine auch nur halbwegs verlässliche Variante, gesichert Titel und auch noch Episodennummer/name erkennen zu können. Und auch Dein Datum/Uhrzeit hilft Dir nicht wirklich weiter. Du könntest natürlich anfangen, die alten EPG Einträge zu speichern und damit eine Datenbank zur Suche aufzubauen. Aber auch die EPGs enthalten meist nicht das, was Du benötigst (na ja, bei Sky steht meist Staffel/Episode mit drin im Text, aber ansonsten ist nur "in die Röhre gucken").


loddoking

#8
ZitatUnd auch Dein Datum/Uhrzeit hilft Dir nicht wirklich weiter.
Nicht vollautomatisch. Jedenfalls ohne weiteres.
Aber so ziemlich die verlässlichste Methode um eine Folge schnell zu indtifizieren. Fernsehserien.de gibt die genaue Sendezeit aller in den vergangenen Jahren gesendeten Serienfolgen an.
Also händisch geht das sogar sehr gut. Nur eben nicht vollautomatisch.

Es wäre sicher sogar machbar sich da ein kleines Tool zusammenzuzimmern das ein abgleich macht. Zumindest über eine einfache csv Datei. Die ist schnell gemacht über copy, paste und bisserl Excelltrickserei.
Die Sendezeit im Dateinamen der Aufnahmen müsste allerdings um die vorlaufzeit angepasst werden. Auch das ist kein Hexenwerk. Mit AutoIT hab ich früher schon komplizierteres gezimmert. Auch wenn ich mich noch unter Laienniveau zuzähler würde
Aber momentan hab ich einfach keinen Kopf dafür. Noch dazu wo es mit sicherheit bereits was brauchbares fertich gibt.
Ist auch nicht so wichtig. Soll mal lieber an besagte batchwerbeerkennung arbeiten der gute Cypheros.;)

Mit Ember hab ich mich noch nicht so beschäftigt. Auf die schnelle konnte ich aber keine PC Version ergoogeln. Läuft das nur auf den Receiverboxen?

Mam

Zitat von: loddoking am April 12, 2018, 14:09:21
Fernsehserien.de gibt die genaue Sendezeit aller in den vergangenen Jahren gesendeten Serienfolgen an.
Also händisch geht das sogar sehr gut. Nur eben nicht vollautomatisch.
Na ja, ein kurzer Blick dorthin bescherte mir keine Info bzgl. eine Abfragemöglichkeit per API. Die meisten Webseiten mögen nicht, wenn ein Tool sie automatisch abgräbt und Daten extrahiert. Die wollen ihren Werbekunden ja mit gutem Gewissen sagen können, wieviel (menschliche) Hits sie hatten. Viele davon haben sogar eine Erkennung und versperren den Robotern den Weg.

Zitat
Mit Ember hab ich mich noch nicht so beschäftigt. Auf die schnelle konnte ich aber keine PC Version ergoogeln. Läuft das nur auf den Receiverboxen?
Nach "Ember" suchen, bringt Dich nicht wirklich weiter, der Name wird von einem anderen Programm belegt. Aktuell heißt die Arbeitsversion "Ember Media Manager" (bzw. "Ember-MM"), die aktuelle Beta (ist immer Beta, wird nie fertig  ;D ) Version gibts hier zum Runterladen.
(oder hier direkt von google)

(Warnung an die ewig Gestrigen: Es gibt keine 32Bit Version mehr, sie macht keinen Sinn, also muss man schon ein 64Bit Windows haben, damit man einen erfolgreichen Doppelklick durchführen kann)

Aber, natürlich hast Du insofern Recht, das Teil ist für die benötigte Aufgabe völlig überzogen. Man muß schon eine ordentliche Filmsammlung haben, damit sich der Einsatz lohnt. Umbenennen ist halt nur ein Abfallprodukt  ;D





www.cypheros.de