Systemy audio do anonomizacji głosu

Ci co przysłuchują się fascynującemu serialowi p.t. komisja śledcza d.s. Amber Gold zauważyli, że ostatnio byli przesłuchiwani funkcjonariusze ABW w trybie anonimowym czyni ich głos był "zgrubiony" by nie można ich było rozpoznać. Z ciekawości wrzuciłem próbkę takuego głosu do popularnego softu do obróbki audio. Co to za anonimizacja, skoro wystarczy podwyższyć ton o kilkanaście procent i już słuchać gościa " normalnie"? Oczekiwałem, że ta anonimizacja wycina i zniekształca nieliniowo tak bardzo, że nie da się uzyskać pierwotnego głosu. Ktoś wie jakiego rodzaju urządzenia używa się do tych celów i czemu tak banalnie można to obejść?? Czy ci biedni świadkowie zdają sobie z tego sprawę?

Reply to
Marek
Loading thread data ...

Dnia Wed, 14 Feb 2018 18:35:44 +0100, Marek napisał(a):

A skad wiesz, ze prawdziwie ? moze jednak skutecznie przetworzyli.

Tak swoja droga, to kiedys sobie piosenke odwtorzylem w zwolnionym tempie, i nagle wokalistka zaczela spiewac męskim glosem.

Jacy tam biedni, na sluzbie. Co im tam, najwyzej awans dostana, zeby pracowac przy biurku.

Chyba, ze ich jednak ktos rozpozna, cos skojarzy, i o falszywe zeznania oskarzy ...

J.

Reply to
J.F.

W dniu 2018-02-14 o 19:11, J.F. pisze:

Może tym agentem przesłuchiwanym był Marek. To swój głos pewnie pozna. :-)

Robert

Reply to
Robert Wańkowski

Dnia Wed, 14 Feb 2018 19:15:46 +0100, Robert Wańkowski napisał(a):

Nie bylbym pewny. Ja sie na nagraniu kompletnie nie poznaje.

No ale jesli agent, to pewnie wiele tasm ze swoim glosem przesluchiwal :-)

J.

Reply to
J.F.

Nie słychać żadnych artefaktów sugerujących modyfikacje, to po pierwsze. Po drugie właśnie flatego pytam, jak działają takie urządzenia, by to wyjaśnić. Bo skoro słychać normalny męski głos, a sugerujesz, że jest to głos zmieniony ale syntetyczny (jak z filmu mission imposible gdzie bohater przez syntezator mowy udawał głos innego bohatera) to po co w takim razie zabawa w zmniejszanie tonu. Bo skoro jest taka możliwość syntezy w inny głos to mógłby mówić przez takie urządzenia tym innym ale "normalnym" glosem. Np. "Iwoną".

Reply to
Marek

W dniu 2018-02-14 o 19:39, Marek pisze:

Jak pokazują twarz z czarnym paskiem na oczach, to zamiast tego paska mogliby wstawić inne oczy. Mają możliwość techniczną a tego nie robią.:-) A nóż będą to moje oczy. I co wtenczas? :-)

Robert

Reply to
Robert Wańkowski

Marek pisze tak:

Nie wiesz czy normalnie bo nie znasz gościa.

Reply to
PiteR

Nie, ja tylko sugeruje, ze byc moze wycieto/zmieniono cos, co sie nie rzuca w oczy, a glos jednak inny.

Ale ma zeznawac, a nie pisac przez klawiature. Rozpoznawanie+synteza ? Beda bledy.

Tak nawiasem mowiac, ta "prosta zmiana tonu" to jakas skomplikowana operacja - bo jak to zrobic, bez zmiany predkosci calosci ?

J.

Reply to
J.F.

W dniu 14.02.2018 o 19:45, Robert Wańkowski pisze:

Nóż albo widelec.

Reply to
Kaczin

On 2018-02-14 19:49, J.F. wrote: (ciap)

Modulacja, demodulacja, przesunięta nośna... (to nie musza być RF)

BTW posłuchaj jak sie stroi odbiornik SSB

Włodek

Reply to
invalid unparseable

W dniu 2018-02-14 o 19:49, J.F. pisze:

W akustyce używa się wokoderów, dla wokalistów nie mających dobrego słuchu. Wtedy wokalista może śpiewać nawet na jednej sylabie, a wokoder "dodaje" melodię bez zauważalnej zmiany głosu.

Chociaż teraz takie czasy, że już mało kto przejmuje się brakiem słuchu :( Swego czasu nawet jakiś dziwoląg z czerwonymi włosami chrypiał i ponoć nawet niektórzy mogli to coś słuchać.

Reply to
Adam

W dniu 2018-02-14 o 18:35, Marek pisze:

Są do tego gotowe układy :) HT8950 lub HT8955 nawet kit do samodzielnego montażu był kiedyś.

Reply to
Jawi

I jak one działają? Wystarczy nagranie przyspieszyć bi mamy z powrotem oryginał?

Reply to
Marek

Chyba nie rzuca w uszy? Gdyby wycięto i zmieniono byloby słychać sztuczność. Dla porównania można odsłuchać innego agenta. Jego głos brzmi zupełnie inaczej, ewidentnie inny facet. Jesli to "pudełko" robiłoby syntezę sztuczną, to obaj powinni brzmieć podobnie -nijak bez cech indywidualnych głosu.

Reply to
Marek

W dniu 2018-02-14 o 22:25, Adam pisze:

Hm, przecież można spowalniać tylko wtedy, gdy padają słowa, czy zdania. A potem, gdy jest pauza, to jej skracanie pozwoli utrzymać tempo zbliżone do naturalnego?

Ło żesz dyrba! Nie wiedziałem... Uwaga: chyba nie "na jednej sylabie", lecz na "tej samej wysokości" (nucie).

A potem zaczął reklamować jakąś firmę, co w logo miała mnóstwo zieleni, i przefarbował się na zielono właśnie ;-)

Reply to
JaNus

Ale zapewne na sali sądowej nagrywać nie można. Hm, hm, co z tego, że "nie można", jak sprawdzić się tego nie da! Dzisiejszy, wielogodzinny zapis audio można zrobić na łebku od szpilki! I wykryć nijak _chyba_ się tego nie da, więc nie da się ustrzec.

Człowieku każdy, Człowieku naiwny, Wielki Brat czuwa, zna Twoje myśli, zanim je wy-myślisz!

Reply to
JaNus

Też o tym myślałem kilka razy jako były realizator studyjny :) Więc tak :

Od strony realizacji to jest banalnie proste. Większość procesorów efektowych w dowolnym studio ma efekt pod tytułem "pitch shifter". Choćby mój ulubiony ENSONIQ DP4. Ale tak naprawdę ten efekt jest w byle badziewiu za kilka zł.

Wpina się toto w dany tor audio na stole mixerskim i wszystko - działa w real time. Można sobie wybrać o ile dźwięk jest obniżony czy podniesiony. Oczywiście tak samo można to zrobić na gotowym materiale audio w każdym programie na PC - jeżeli dźwięk został nagrany jako nie zniekształcony.

A na ile to jest proces "odwracalny" ? To zależy od konkretnego danego efektu. I teraz - żeby głos po modyfikacji był nadal w miarę zrozumiały, to jest obniżany nie więcej niż kilka półtonów - inaczej robi się zbyt niski. To zaś powoduje, że ten proces jest dość dobrze odwracalny bo nie wprowadza zbyt dużych ingerencji w dźwięk.

  • jak to jest robione :

jako że dziś 100% wszelkich efektów jest w pełni cyfrowych to pitch shifting jest robiony sposób zupełnie odmienny od dawnych analogowych metod - żadnych tam harmonicznych itp.

Po prostu robiona jest np. analiza fouriera, potem poszczególne składowe obniża się o daną wartość, składa spowrotem i voila. Efekty studyjne mają to do siebie, że one powinny obniżać dźwięk a nie go modyfikować - więc proces odwrotny efekt likwiduje :)

(zwykłe obniżenie wszystkich składowych o stałą wartość obniża dźwięk, ale jednocześnie zmienia jego barwę - nie tylko wysokość - dlatego dziś prawie zawsze oprócz tego robione są specjalne zabiegi na takim obniżonym sygnale, żeby zachować naturalność brzmienia)

Dalej - realizator programu ma obowiązek dźwięk zmienić - nikt nie precyzuje jak to ma się technicznie odbyć i na ile być skuteczne.

99% osób, które się "ukrywają" za taką modyfikacją głosu nie mają pojęcia, jak to jest nieskuteczne - zapewne wielu z tych zainteresowanych kto to mówi również :)

Oczywiście dałoby się głos zmienić tak, żeby "odszyfrowanie" było trudne, ale to wymagałoby użycia czegoś więcej, niż realizator audio ma pod ręką - po drugie ktoś musiałby o tym pomyśleć - a po trzecie musiałoby mu się chcieć :)

Czyli - po prostu życie. Ciekawe tylko ile razy taka "anonimowa osoba" potem dostała po mordzie :)

Reply to
sundayman

Dodam jeszcze jako ciekawostkę.

Swego czasu (jakieś 20 lat temu) musiałem zrobić urządzenie do szyfrowania dźwięku w telefonach (analogowych jeszcze).

Było to robione na dedykowanych układach, które robiły to analogowo - "odbijały" widmo sygnału w sposób lustrzany tzn. niskie składowe zamieniała w wysokie i odwrotnie.

Oczywiście odbywało się to "w locie", w sposób niezauważalny dla użytkownika telefonu - słyszało się rozmówcę normalnie, ale po podłączeniu się "do drutów" np. w centrali nie dało się nic zrozumieć :)

Efekt jest bardzo skuteczny - nie da się zupełnie mowy zrozumieć, brzmi to jest rozmowa kosmitów :) Ale oczywiście i to jest do "odczytania" jeżeli się wie, że to taki sygnał - wystarczy do tego odpowiedni "plugin" do programu audio i po zawodach...

W tamtym czasie jednak osoby, które miały tego nie móc podsłuchać, nie dysponowały ani wiedzą ani sprzętem jak to zrobić - i całość była skuteczna :)

Reply to
sundayman

W dniu 2018-02-15 o 02:13, sundayman pisze:

No chociażby to, co proponował ktoś powyżej: wpierw proces VR (Voice Recognition) do postaci ASCII, a potem użycie głosu syntetycznego, np. "Bernerd Ładysz", albo wręcz przeciwnie, jakiś sopran. Ale... i ta metoda nie daje 100% pewności (o dziwo). Bowiem wielu ludzi ma pewne przyzwyczajenia, np. ulubione zwroty ("mocium Panie") czy inne naleciałości. I _czasem_ po tym można by ich rozpoznać. No a przecież to, o czym mówią, o czym mają jakąś wiedzę — krąg możliwości mocno zawęża. I cała anonimizacja, wielce wyrafinowana — idzie się pieprzyć!

Reply to
JaNus

W dniu 2018-02-15 o 02:21, sundayman pisze:

Ciekawe! Jako elektroniczny dyletant nigdy bym na to nie wpadł. Ale słyszałem np. o telefonicznych liniach "bezpiecznych", i to bezpiecznych... podwójnie. Bo primo nie dało się podobno (prosto) ich podsłuchiwać, a po secundo to były one w użyciu przez Urzędy Bezpieczeństwa Publicznego we wczesnym PRL-u (choć jeszcze państwo nazywało się inaczej, rządził PKWN). Nazywało się to "telefon Wysokiej Częstotliwości". Czy ktoś może przybliżyć, na czym polegała niemożność podsłuchiwania?

Reply to
JaNus

ElectronDepot website is not affiliated with any of the manufacturers or service providers discussed here. All logos and trade names are the property of their respective owners.