Gespräch oder Musik?

Übersicht Sonstiges Smalltalk

Neue Antwort erstellen

Geeecko

Betreff: Gespräch oder Musik?

BeitragDo, März 26, 2009 18:37
Antworten mit Zitat
Benutzer-Profile anzeigen
Hallo!
Wie würdet ihr es machen, wenn ihr Gespräche (zum Beispiel das Gelaber vom Moderator im Radio) von Musik (auch im Radio xD) unterscheiden müsst?
Mit einem Programm, versteht sich.
Würdet ihr die Bässe "analysieren"?
Oder vllt doch nach der Lautstärke gucken?
Ich weiß nämlich nicht, wie ich das Problem lösen könnte...
Habt ihr ein paar Tipps für mich?

lg MD
 

Rocys

BeitragDo, März 26, 2009 18:54
Antworten mit Zitat
Benutzer-Profile anzeigen
Ich wuerde wahrscheinlich die Dynamik anschauen. Popmusik ist meistens ueber weite Strecken stark komprimiert, waehrend Sprache eigentlich sehr dynamisch ist, viele kurze Pausen hat usw.
 

Tritium

BeitragDo, März 26, 2009 19:14
Antworten mit Zitat
Benutzer-Profile anzeigen
Meister_Dieb hat Folgendes geschrieben:
[...] zum Beispiel das Gelaber vom Moderator im Radio [...]

Rocys hat Folgendes geschrieben:
Popmusik ist meistens ueber weite Strecken stark komprimiert, waehrend Sprache eigentlich sehr dynamisch ist, viele kurze Pausen hat usw.


Für Sprache trifft das, was das Radio angeht, bei fast keinem Radiosender mehr zu, da viele sog. Kompressoren benutzen:
http://www.thomann.de/de/drawmer_s3.htm

Eine Erklärung dazu gibts hier:
http://www.thomann.de/de/onlineexpert_46.html

Kurz gesagt sorgen Kompressoren dafür, dass die Stimme des Moderators viel dichter wirkt, indem die Dynamik eingeschränkt wird. Das wollte ich nur zu bedenken geben, ansonsten kann ich leider auch nicht weiterhelfen Wink

hectic

Sieger des IS Talentwettbewerb 2006

BeitragDo, März 26, 2009 20:24
Antworten mit Zitat
Benutzer-Profile anzeigen
Wenn es nur zur Unterscheidung zwischen Musik und Gespräch geht, dann würde ich es über eine Frequenzanalyse machen. Und zwar das gesamte Frequenzspektrum. Denn ein Sprecher kann meiner Einschätzung nach zwei Frequenzen auf einmal erzeugen. Einmal die Sprache (Frequenz ~300 - 500 Hz) und das zischen bei ''S'', ''H'' etc... [Frequenz ~2000 - 10000 Hz). Auch der Vorschlag von Rocys mit dem kurzen Pausen zwischen den Wörtern sind ein gutes Indiz (problematisch aber bei Gabber- oder bestimmter Trancemusik). Analysiert man nun diesen Bereich und prüft parallel dazu, dass keine dieser Frequenzen auf längere Dauer gleich blebt, kann man von Sprache ausgehen. Bei Musik dagegen wird oft eine Bassdrum eingesetzt, die dann so bei ~50 - 150 Hz liegt. Außerdem hört man bei Musik oft auch eine Dauerbeschalung im hohem Frequenzbereich (zum Beispiel High-Hats und ähmliches). Bei Rockmusik ist wiederrum das ganze Spektrum vollbelastet. Bei Elektromusik dageben endstehen oft im mittlerem Frequenzbereich ganze Lücken. Klassische Musuk zu indentifizieren wäre dagen schon etwas schwieriger...
Download der Draw3D2 V.1.1 für schnelle Echtzeiteffekte über Blitz3D

BigMaexle

BeitragFr, März 27, 2009 0:06
Antworten mit Zitat
Benutzer-Profile anzeigen
naja, Musik ist rythmisch, während Sprache eher ungeordnet ist. Also wenn man gleichmäßigkeiten in einer Audiospur findet, also regelmäßige betimmte Fequenzschläge (Schlagzeug), oder längere gleichmäßige Frequenzen findet, dann kann man wohl davon ausgehen, dass es Musik ist. wenn alles irgendwie ungeordnet und durcheinander ist, ist es wohl Sprache.

Ich habe wirklich keine Ahnung von dem Thema, aber das wären so meine Ideen
--------------------------------------
Ich bin unfreiwillig ein Mitglied dieser kapitalistischen Gesellschaft, wo jeder Geldgeile Unternehmer an mein Geld will und ich selbst bei meinen Entscheidungen so gut wie willenlos bin...... und ich bin glücklich drüber

Smily

BeitragFr, März 27, 2009 16:39
Antworten mit Zitat
Benutzer-Profile anzeigen
Ich kenn mich mit dem Thema zwar nicht aus, aber ich würde wohl so rangehen:

Als erstes würde ich mir die visualsierung der Tonspuren ansehen (kann ja mittlerweile jedes bessere Musikprogramm), und da nach sichtbaren unterschieden zwischen reden und musik suchen.
Und erst, wenn ich die unterschiede soweit kenne, dass ich dem auge zwischen einer sprach- und musikspur unterscheiden kann, dann würde ich mir gedanken darüber machen, wie diese Unterscheidung automatisch realisiert werden kann.

Grüße,
Smily
Lesestoff:
gegen Softwarepatente | Netzzensur | brain.exe | Unabhängigkeitserklärung des Internets

"Wir müssen die Rechte der Andersdenkenden selbst dann beachten, wenn sie Idioten oder schädlich sind. Wir müssen aufpassen. Wachsamkeit ist der Preis der Freiheit --- Keine Zensur!"
stummi.org

Geeecko

BeitragFr, März 27, 2009 21:02
Antworten mit Zitat
Benutzer-Profile anzeigen
Danke schonmal!
Hilft mir schon weiter Smile


lg MD

Neue Antwort erstellen


Übersicht Sonstiges Smalltalk

Gehe zu:

Powered by phpBB © 2001 - 2006, phpBB Group