Scientific Journal of the BirdLife Hungary

A Magyar Madártani és Természetvédelmi Egyesület tudományos folyóirata

Ornis Hungarica. vol.27(2). (2019) p.59-66.

Automatic bird song and syllable segmentation with an open-source deep-learning object detection method – a case study in the Collared Flycatcher (Ficedula albicollis)
Sándor Zsebők, Máté Ferenc Nagy-Egri, Gergely Gábor Barnaföldi, Miklós Laczi, Gergely Nagy, Éva Vaskuti & László Zsolt Garamszegi

Cikk letöltése: [pdf] (1525 Kb)

Kivonat:

Az állati bioakusztikai kutatások jelentős mennyiségű digitalizált hangfelvételt produkálnak, így hatékony automatikus feldolgozási módszerekre van szükség a felvételek információtartalmának kinyerésére. Kutatásunk középpontjában az örvös légykapó (Ficedula albicollis) énekének viselkedésökológiai szempontból történő vizsgálata áll. Az elmúlt 20 évben több száz órányi hangfelvételt készítettünk a faj természetes élőhelyén, és ezek feldolgozására automatikus módszereket kerestünk. Tanulmányunkban egy nyílt forráskódú, mélytanulású (deep learning) képdetektálási módszert használtunk az örvös légykapó (1) énekének hangfelvételen belüli megtalálására, és (2) az éneket felépítő egységek, a szillabusok megkeresésére. Mindkét esetben az énekeket spektrogrammá alakítottuk, és két külön modellt tanítottunk be a detektálási feladatokra. Mindkét feladat esetében a módszer ígéretesnek tűnik, jelentősen csökkentve a feldolgozáshoz szükséges emberi időt, ami lehetővé teszi minőségileg új, bioakusztikával kapcsolatos kérdések vizsgálatát.