Kaip „Shazam“ tiksliai atpažįsta muziką?

Kaip „Shazam“ tiksliai atpažįsta muziką?

Ar kada susimąstėte, kaip Shazamas „girdi“ jūsų grojamą muziką ir taip tiksliai ją atpažįsta? Na, tu ne vienas.





Muzikos atpažinimo paslaugą maitinanti technologija daugeliui yra mįslė, ypač todėl, kad ši paslauga buvo pradėta teikti prieš daugelį metų, kol išmanieji telefonai ir mašininis mokymasis tapo dalyku.





Šiame straipsnyje apžvelgsime, kaip veikia „Shazam“ ir kaip jis gali tiksliai atpažinti muziką.





Kas yra Shazamas?

Shazam yra populiari muzikos atpažinimo programa, kurią galite naudoti norėdami rasti informacijos apie naują dainą, kuri jums patinka, bet nežinote pavadinimo ar atlikėjo vardo.

Tarkime, kad esate kavinėje ar vaikštote po kampinę parduotuvę ir išgirsite naują dainą, kurią norėtumėte turėti savo muzikos bibliotekoje. „Shazam“ padeda lengvai rasti dainą. Viskas, ką jums reikia padaryti, tai įrašyti kelias dainos sekundes programoje.



„Shazam“ programoje naudojama sudėtinga garso atpažinimo technologija, kad per kelias sekundes būtų galima atpažinti išgirstą muziką, kad galėtumėte sužinoti atlikėjo vardą ir takelį, žiūrėti vaizdo įrašus ir net įsigyti ar transliuoti dainą savo prietaise.

Parsisiųsti: Shazam už ios | „Android“ (Laisvas)





Kaip veikia Shazam?

Vaizdų galerija (4 vaizdai) Išplėsti Išplėsti Išplėsti Išplėsti Uždaryti

„Shazam“ naudoja patentuotą technologiją, kurią sukūrė programos įkūrėjas ir vyriausiasis duomenų mokslininkas Avery Lin-Chun Wang, kad nustatytų jos platformoje užklaustų dainų atitikmenis. Ši technologija sukuria garso įrašų pirštų atspaudus, o tai yra slaptas „Shazam“ atpažinimo įgūdžių padažas.

„Shazam“ sukuria ir saugo garso pirštų atspaudus, sudarytus iš kiekvienos daugiau nei 15 milijardų dainų skaitmeninių duomenų rinkinių. Kai vartotojas Shazams dainą, Shazam greitai sukuria garso piršto atspaudą iš garso, gauto iš išmaniojo telefono ar kompiuterio mikrofono.





Sukūręs garso piršto atspaudą įrašui, „Shazam“ įkelia garso piršto atspaudą (o ne garsą) į savo serverį, kuriame atlieka duomenų bazės paiešką. Jei randama atitiktis, ji grąžina dainos informaciją, nurodydama, kur ją transliuoti ar įsigyti, kartu su identifikavimo informacija.

Kas yra garso pirštų atspaudas?

Garso pirštų atspaudai yra sutrumpinta skaitmeninė garso signalų santrauka. Jie naudojami garso pavyzdžiui identifikuoti arba panašiems elementams surasti garso duomenų bazėje.

„Shazam“ garso pirštų atspaudų technologija gali suderinti nepažymėtas garso turinio dalis su atitinkamomis atitikmenimis savo garso duomenų bazėje. „Shazam“ atpažįsta įrašytos dainos pavadinimą (nepažymėtas garso turinys), suderindamas dainos pirštų atspaudus su jos duomenų bazėje esančių dainų pirštų atspaudais.

„Shazam“ sukuria unikalius dainų pirštų atspaudus savo duomenų bazėje, naudodamas tam tikrus duomenų taškus, identifikuotus naudojant spektrogramą.

Kas yra Spektrograma?

Spektrograma yra trimatis grafikas, naudojamas kaip garso atvaizdas. Spektrograma rodo dažnių pokyčius per tam tikrą laikotarpį, taip pat atsižvelgiant į amplitudę ar garsumą. Žemiau pateikta nuotrauka yra spektrogramos skaitymo pavyzdys.

Vaizdo kreditas: Changhua pakrantės išsaugojimo veiksmas/ https://search.creativecommons.org/photos/e6b0b0f3-79ea-4621-9029-1b73365a52ac

2003 metų interviu su Mokslininkas amerikietis , Avery Wang atskleidė, kad Shazam algoritmas naudoja pirštų atspaudų generavimui naudojamus spektrogramos taškus, vaizduojančius didžiausią energiją turinčias natas.

Nepaisydamas daugumos dainos informacijos ir sutelkdamas dėmesį tik į keletą apibrėžiančių natų, „Shazam“ gali ieškoti duomenų bazėje ir neįtikėtinu greičiu pateikti tikslią dainų užklausų atitiktį.

Kaip „Shazam“ sugeba atpažinti dainas triukšmingose ​​vietose?

„Shazam“ naudoja dainų įrašus be foninio triukšmo ir iškraipymų, kad sukurtų pirštų atspaudus savo duomenų bazei. Kai įrašote dainą naudodami programą triukšmingoje vietoje, ji sukuria garso įrašo piršto atspaudą, nustatydama didžiausią įrašo energiją turinčias natas.

Tada ji savo duomenų bazėje ieško įrašo garso pirštų atspaudų atitikmens, jei foninio triukšmo lygis nebuvo pakankamai aukštas, kad iškraipytų duomenis, naudojamus garso pirštų atspaudams sukurti.

Laikai, kai Shazamas negali padėti jums atpažinti dainos

„Shazam“ puikiai suderina dainas, net ir neaiškią muziką, kurios, jūsų manymu, gali nebūti savo duomenų bazėje. Bet ar yra momentų, kai Shazamas negali nustatyti takelio?

Iškraipytas įrašymas

Kai dainuosite dainą toje vietoje, kur foninis triukšmo lygis yra per didelis, triukšmas iškraipo spektrogramos duomenis. Dėl to jūsų įrašo garso pirštų atspaudai skirsis nuo originalios dainos.

Kai tai atsitiks, Shazamas grąžina Daina nežinoma dialogą, nes negali rasti garso piršto atspaudo atitikmens.

Gyva muzika

„Shazam“ nesugeba atpažinti muzikos iš gyvų pasirodymų. Taip yra todėl, kad gyvai atliekamų pasirodymų metu įrašomas garsas dažnai skiriasi nuo originalios dainos versijos, kurią Shazam naudoja garso pirštų atspaudams kurti.

Vienintelis būdas Shazam atpažinti dainą gyvo pasirodymo metu yra, jei grupė yra pakankamai kvalifikuota, kad atliktų dainą tiksliai tokią, kokia buvo įrašyta. Sėkmės grupei bandant tai padaryti ...

Jūsų balso įrašymas

Ar galėčiau priversti Shazamą atpažinti dainą, kurią dainuoju, jei būčiau tikrai gera dainininkė?

Trumpai tariant, ne.

„Shazam“ algoritmas gali atpažinti tik iš anksto įrašytą muziką. Kad Shazamas galėtų atpažinti dainą, kurią dainuojate, turite turėti tą patį vokalą su instrumentiniais instrumentais tiksliu tempu su originaliu dainos įrašu.

kiek pakeisti „MacBook“ oro bateriją

Tavo dūzgimas

„Shazam“ negali nustatyti „Hums“ atitikmenų, nes jo algoritmas naudoja tikslius dažnius ir amplitudes, kad sukurtų garso pirštų atspaudus dainoms savo duomenų bazėje.

Kai niūniuojate dainą, Shazamas sukuria jai piršto atspaudą. Bet kadangi ūžesys yra tik bandymas iš naujo sintezuoti dainą, algoritmas neatitiks įrašo.

Ar „Shazam“ yra vienintelė muzikos identifikavimo programa?

„Shazam“ buvo pirmoji muzikos atpažinimo paslauga ir šiuo metu yra plačiausiai naudojama dainų identifikavimo programa. Tačiau yra kitos programos, kuriomis galite identifikuoti dainą žaidžia aplink tave. Kai kurie netgi gali atpažinti dainą, kurią dainuojate ar dūzgate.

Trys populiariausios „Shazam“ alternatyvos yra „SoundHound“, „Musixmatch Lyrics“ ir „Genius“. „Musixmatch“ ir „Genius“ pirmiausia padeda nustatyti aplink jus grojančios muzikos žodžius, o „SoundHound“ yra artimiausias „Shazam“ konkurentas.

Susijęs: Geriausios muzikos atpažinimo programos, leidžiančios rasti dainas pagal jų melodiją

Naudodami „SoundHound“ programą galite atlikti beveik viską, ką daro „Shazam“. Pagrindinis jo pranašumas, palyginti su „Shazam“, yra tai, kad jis turi papildomą funkciją, leidžiančią atpažinti jūsų dainuojamas ar niūniuojamas dainas.

Vaizdo kreditas: Sulastri Sulastri / Shutterstock.com

Dalintis Dalintis „Tweet“ Paštu Kaip atpažinti muziką ir dainas „YouTube“ vaizdo įrašuose: 5 būdai

Sužinokite, kaip rasti dainą iš vaizdo įrašo „YouTube“ ar kitur, naudojant „Shazam“ ir įvairius kitus metodus.

Skaityti toliau
Susijusios temos
  • Technologija paaiškinta
  • Shazam
  • Muzikos atradimas
  • „SoundHound“
  • Musixmatch
Apie autorių John Awa-abuon(Paskelbti 62 straipsniai)

Jonas yra technologijų mylėtojas nuo gimimo, skaitmeninio turinio kūrėjas pagal išsilavinimą ir „Tech Lifestyle Writer“ pagal profesiją. Jonas tiki, kad padeda žmonėms išspręsti problemas, ir rašo straipsnius, kurie tai daro.

Daugiau iš John Awa-abuon

Prenumeruokite mūsų naujienlaiškį

Prisijunkite prie mūsų naujienlaiškio, kad gautumėte techninių patarimų, apžvalgų, nemokamų el. Knygų ir išskirtinių pasiūlymų!

Norėdami užsiprenumeruoti, spustelėkite čia