Voicebot
En voicebot er en AI-bot som kommuniserer med mennesker via stemme i stedet for tekst. Den brukes typisk på telefon (AI-telefonassistent, AI-resepsjonist), men også som stemmegrensesnitt i apper, smarte enheter eller på nettsider. Termen kommer fra engelsk og er bredt brukt i norsk teknologi-vokabular.
For norske SMB-er er den mest aktuelle voicebot-varianten en stemmeagent på telefon — den som besvarer innkommende anrop til bedriften og fører ekte dialog med innringeren. Andre voicebot-bruksområder inkluderer stemmestyrte assistenter i biler, stemmegrensesnitt i kunde-apper, stemmebot i kontaktsentre, og tilgjengelighetsverktøy for synshemmede. Felles for alle er at AI-en jobber via stemme i stedet for skjerm og tastatur.
Under hetten består en voicebot av tre koordinerte teknologier som hver har sin egen forskningstradisjon. Talegjenkjenning (automatic speech recognition / ASR) konverterer innringerens lyd til tekst og må håndtere bakgrunnsstøy, dialekt og varierende lydkvalitet. Språkmodellen (natural language understanding / NLU + large language model / LLM) tolker hva innringeren faktisk vil og bestemmer hva som skal gjøres. Talesyntese (text-to-speech / TTS) konverterer svaret til naturlig stemme — moderne TTS som ElevenLabs er finjustert per språk, og kvalitetsforskjellen mellom 2020-stemmer og 2026-stemmer er enorm.
Viktig innsikt
Gartner (2024): til 2026 vil 40 % av all kundekontakt mellom forbrukere og bedrifter gå via en voicebot på minst ett steg av reisen — mest på telefon for lokale tjenestebedrifter.
Hvordan det fungerer
Voicebot består av tre komponenter: speech-to-text (konvertere tale til tekst), en språkmodell (forstå og svare), og text-to-speech (konvertere svar til naturlig stemme). Hele sløyfen tar typisk under ett sekund og lar voicebot føre flytende toveis samtaler.
Fordeler
Bruksområder
- AI-telefonassistent for småbedrifter.
- Stemmebasert kundeservice på nettsiden.
- Drive-thru-bestilling i hurtigmat.
- Stemmestyrt navigasjon i kontaktsenter.
- Tilgjengelighetsverktøy for brukere med synshemming.
- Når voicebot ikke passer: akutte saker (112/113), krisepsykiatri, samtaler i ekstremt støyfulle omgivelser der talegjenkjenningen sliter, eller bruksområder der lokal lov krever menneskelig vurdering. Skaala-voiceboten eskalerer slike samtaler direkte til menneske med full samtalekontekst.
Sammenligning med alternativer
Voicebot vs. chatbot: voicebot er stemme, chatbot er tekst. For telefon-først bedrifter er voicebot kommersielt viktigere.
Voicebot vs. talepost: talepost mister 80 %, voicebot fanger 100 %.
Voicebot vs. tradisjonell IVR med tastetonemeny: IVR har 30-50 % avbruddsrate fordi innringere ikke gidder å navigere et menytre. Voicebot lar innringeren snakke fritt og avbruddsraten faller typisk under 5 %.
Voicebot vs. menneskelig kundesenter-operatør: voicebot dekker 24/7 og koster typisk 1/10 av en heltids-operatør. Menneske er fortsatt overlegen ved emosjonelt komplekse saker og forhandlinger; hybridmodell der voicebot tar rutinen og menneske tar de vanskelige sakene er praktisk standard i SMB-segmentet.
Relaterte termer
Vanlige spørsmål
Forskjell på voicebot og chatbot?
Voicebot er stemme, chatbot er tekst. Samme språkmodell i kjernen, ulike kanaler. For lokale norske bedrifter er telefon (voicebot) ofte 60-70 % av kommersielt verdifulle henvendelser.
Hvilke handlinger kan voicebot utføre?
Booking i Google Calendar, Outlook, Bokadirekt eller Timma; SMS-bekreftelse til kunden; viderekobling til ansatt i Teams/Slack; opprettelse av sak i CRM (HubSpot, Pipedrive, Salesforce via API); og generering av samtalesammendrag etter samtalen.
Når passer ikke en voicebot?
Ved akuttsamtaler (112/113), krisepsykiatri, juridisk bindende rådgivning, eller saker der lokal lov krever menneskelig vurdering. Skaala eskalerer disse direkte til menneske.
Hvor lang tid tar oppsettet?
Grunnoppsettet tar typisk under 5 minutter — Skaala leser åpningstider, tjenester og priser fra bedriftens nettside automatisk. Du finjusterer ruteregler og kobler kalender før første live-samtale.
Kostnad?
Skaala fra 299 kr/måned.
Naturlig stemme?
Ja, ElevenLabs-stemmer finjustert på norsk bokmål med naturlig prosodi. Talegjenkjenningen forstår også nynorsk og de vanligste dialektene (vestlandsk, trøndersk, nordnorsk).
GDPR?
EU-datalagring.
Hvordan Skaala bruker voicebot
Skaala er en voicebot bygd for telefon: lokalt norsk nummer inkludert i abonnementet (ett per team, alle planer), ElevenLabs-stemme finjustert på norsk bokmål, talegjenkjenning som håndterer nynorsk og dialekter, integrasjon med Google Calendar, Outlook, Bokadirekt og Timma, automatisk SMS-bekreftelse, AI-sammendrag av hver samtale i Teams/Slack/e-post, og GDPR-kompatibel EU-datalagring (Frankfurt eller Stockholm). DPA tilgjengelig ved forespørsel.
Kommersielle vilkår: Essentials 299 kr/måned, Business 1 499 kr/måned, 7 dagers gratis prøveperiode med betalingsmetode ved oppstart. Helsenormen, BankID og PCI-DSS er ikke en del av produktet i dag.