Gespräch oder Musik?
Übersicht

![]() |
GeeeckoBetreff: Gespräch oder Musik? |
![]() Antworten mit Zitat ![]() |
---|---|---|
Hallo!
Wie würdet ihr es machen, wenn ihr Gespräche (zum Beispiel das Gelaber vom Moderator im Radio) von Musik (auch im Radio xD) unterscheiden müsst? Mit einem Programm, versteht sich. Würdet ihr die Bässe "analysieren"? Oder vllt doch nach der Lautstärke gucken? Ich weiß nämlich nicht, wie ich das Problem lösen könnte... Habt ihr ein paar Tipps für mich? lg MD |
||
Rocys |
![]() Antworten mit Zitat ![]() |
|
---|---|---|
Ich wuerde wahrscheinlich die Dynamik anschauen. Popmusik ist meistens ueber weite Strecken stark komprimiert, waehrend Sprache eigentlich sehr dynamisch ist, viele kurze Pausen hat usw. | ||
Tritium |
![]() Antworten mit Zitat ![]() |
|
---|---|---|
Meister_Dieb hat Folgendes geschrieben: [...] zum Beispiel das Gelaber vom Moderator im Radio [...]
Rocys hat Folgendes geschrieben: Popmusik ist meistens ueber weite Strecken stark komprimiert, waehrend Sprache eigentlich sehr dynamisch ist, viele kurze Pausen hat usw.
Für Sprache trifft das, was das Radio angeht, bei fast keinem Radiosender mehr zu, da viele sog. Kompressoren benutzen: http://www.thomann.de/de/drawmer_s3.htm Eine Erklärung dazu gibts hier: http://www.thomann.de/de/onlineexpert_46.html Kurz gesagt sorgen Kompressoren dafür, dass die Stimme des Moderators viel dichter wirkt, indem die Dynamik eingeschränkt wird. Das wollte ich nur zu bedenken geben, ansonsten kann ich leider auch nicht weiterhelfen ![]() |
||
![]() |
hecticSieger des IS Talentwettbewerb 2006 |
![]() Antworten mit Zitat ![]() |
---|---|---|
Wenn es nur zur Unterscheidung zwischen Musik und Gespräch geht, dann würde ich es über eine Frequenzanalyse machen. Und zwar das gesamte Frequenzspektrum. Denn ein Sprecher kann meiner Einschätzung nach zwei Frequenzen auf einmal erzeugen. Einmal die Sprache (Frequenz ~300 - 500 Hz) und das zischen bei ''S'', ''H'' etc... [Frequenz ~2000 - 10000 Hz). Auch der Vorschlag von Rocys mit dem kurzen Pausen zwischen den Wörtern sind ein gutes Indiz (problematisch aber bei Gabber- oder bestimmter Trancemusik). Analysiert man nun diesen Bereich und prüft parallel dazu, dass keine dieser Frequenzen auf längere Dauer gleich blebt, kann man von Sprache ausgehen. Bei Musik dagegen wird oft eine Bassdrum eingesetzt, die dann so bei ~50 - 150 Hz liegt. Außerdem hört man bei Musik oft auch eine Dauerbeschalung im hohem Frequenzbereich (zum Beispiel High-Hats und ähmliches). Bei Rockmusik ist wiederrum das ganze Spektrum vollbelastet. Bei Elektromusik dageben endstehen oft im mittlerem Frequenzbereich ganze Lücken. Klassische Musuk zu indentifizieren wäre dagen schon etwas schwieriger... | ||
Download der Draw3D2 V.1.1 für schnelle Echtzeiteffekte über Blitz3D |
![]() |
BigMaexle |
![]() Antworten mit Zitat ![]() |
---|---|---|
naja, Musik ist rythmisch, während Sprache eher ungeordnet ist. Also wenn man gleichmäßigkeiten in einer Audiospur findet, also regelmäßige betimmte Fequenzschläge (Schlagzeug), oder längere gleichmäßige Frequenzen findet, dann kann man wohl davon ausgehen, dass es Musik ist. wenn alles irgendwie ungeordnet und durcheinander ist, ist es wohl Sprache.
Ich habe wirklich keine Ahnung von dem Thema, aber das wären so meine Ideen |
||
--------------------------------------
Ich bin unfreiwillig ein Mitglied dieser kapitalistischen Gesellschaft, wo jeder Geldgeile Unternehmer an mein Geld will und ich selbst bei meinen Entscheidungen so gut wie willenlos bin...... und ich bin glücklich drüber |
![]() |
Smily |
![]() Antworten mit Zitat ![]() |
---|---|---|
Ich kenn mich mit dem Thema zwar nicht aus, aber ich würde wohl so rangehen:
Als erstes würde ich mir die visualsierung der Tonspuren ansehen (kann ja mittlerweile jedes bessere Musikprogramm), und da nach sichtbaren unterschieden zwischen reden und musik suchen. Und erst, wenn ich die unterschiede soweit kenne, dass ich dem auge zwischen einer sprach- und musikspur unterscheiden kann, dann würde ich mir gedanken darüber machen, wie diese Unterscheidung automatisch realisiert werden kann. Grüße, Smily |
||
Lesestoff:
gegen Softwarepatente | Netzzensur | brain.exe | Unabhängigkeitserklärung des Internets "Wir müssen die Rechte der Andersdenkenden selbst dann beachten, wenn sie Idioten oder schädlich sind. Wir müssen aufpassen. Wachsamkeit ist der Preis der Freiheit --- Keine Zensur!" stummi.org |
![]() |
Geeecko |
![]() Antworten mit Zitat ![]() |
---|---|---|
Danke schonmal!
Hilft mir schon weiter ![]() lg MD |
||
Übersicht


Powered by phpBB © 2001 - 2006, phpBB Group