Forskare vid Lunds universitet utvecklar en forensisk talarjämförelse med hjälp av logopedi, AI, matematik och maskininlärning. Metoden ska hjälpa polisen att analysera ljudupptagningar i brottsutredningar.
Precis som fingeravtryck och DNA bär rösten unika egenskaper som kan kopplas till individer. Tal och röst påverkas av flera faktorer, såsom stämbandens storlek, munhålans form, språkbruk och andning. Medan de flesta kan uppfatta kön, ålder eller sinnesstämning hos en talare, krävs specialistkunskap för att objektivt analysera röstens unika mönster – ett område logopeder är experter på.
Polisen vände sig till Lunds universitet för hjälp med att analysera ljudupptagningar i en utredning. Förfrågan ledde till utvecklingen av forensisk talarjämförelse som en metod för bevisföring.
Polisen hanterar ofta ljudupptagningar där talaren är känd, men också inspelningar där syftet är att bekräfta eller utesluta en misstänkt.
– Det vi gör i nuläget är att låta tre bedömare, logopeder, analysera tal, röst och språk i inspelningarna för att sedan kunna jämföra dem. Vi lyssnar efter flera faktorer, till exempel hur personen i fråga producerar sin röst, artikulerar, verkar röra tungan och läpparna, säger Susanna Whitling, , logoped och forskare vid Lunds universitet, i ett pressmeddelande.
Både större datamängder och spjutspetsanalys
Antalet förfrågningar från polisen har ökat, vilket gjort det svårt för bedömare att hinna med alla inspelningar. För att hantera större datamängder har forskarna utvecklat AI-baserade metoder som kan identifiera relevanta ljudfiler, som sedan analyseras av experter.
– Genom att kombinera traditionell logopedisk perceptuell bedömning av tal röst och språk med maskininlärning, vill vi göra det möjligt, både att skanna stora mängder data och erbjuda spjutspetsanalys. Utifrån de träffar som AI sedan lyfter ut, kan experter göra en professionell bedömning, förklarar Whitling.
Vidare samarbetar forskarna med bland andra Andreas Jakobsson, som är professor i matematisk statistik, för att utveckla specialiserad mjukvara. Visionen är att ha en träffsäker och rättssäker talarjämförelse.
– Vi logopeder kan göra perceptuell bedömning och undersöka sannolikheten att två inspelningar innehåller samma persons tal, röst och språk. När man lägger till utveckling av specialiserad mjukvara för så kallad akustisk analys för exempelvis röstens frekvens, intensitet och tidsvariationer, så samarbetar vi med experter inom signalbehandling och maskininlärning.