Website Indexering
Hoe jouw website wordt gescand en geanalyseerd
Wanneer je een website toevoegt aan VibeChat, start ons systeem een intelligent crawlproces. Dit proces werkt als volgt:
Stap 1: URL Ontdekking
De crawler begint bij de URL die je opgeeft en zoekt automatisch naar de sitemap.xml van je website. Een sitemap is een XML-bestand dat alle belangrijke pagina's van je website bevat. Als er geen sitemap beschikbaar is, volgt de crawler automatisch alle interne links op je pagina's om zo je volledige website in kaart te brengen.
Stap 2: Content Extractie
Voor elke gevonden pagina extraheert ons systeem de relevante tekstuele content. Hierbij worden automatisch irrelevante elementen zoals navigatiemenu's, footers, advertenties en scripts gefilterd. Alleen de daadwerkelijke inhoud wordt opgeslagen:
- Paginatitel en beschrijving (meta tags)
- Hoofdtekst en paragrafen
- Lijsten en tabellen
- Afbeeldingsbeschrijvingen (alt-teksten)
💡 Tip: Je kunt zelf bepalen welke gecrawlde pagina's actief zijn voor de chatbot. Zo heb je volledige controle over de kennisbasis van je chatbot.
RAG Technologie
Retrieval-Augmented Generation uitgelegd
RAG staat voor Retrieval-Augmented Generation en is de kern van hoe VibeChat werkt. In plaats van dat de AI "verzint" wat het antwoord zou kunnen zijn, haalt RAG eerst relevante informatie op uit jouw website-content voordat er een antwoord wordt gegenereerd.
Vraag Analyse
De vraag van de bezoeker wordt geanalyseerd en omgezet naar een zoekopdracht.
Relevante Data
Het systeem doorzoekt jouw website-content en vindt de meest relevante passages.
Antwoord Generatie
De AI formuleert een natuurlijk antwoord op basis van de gevonden informatie.
Waarom RAG?
- Accuraatheid: Antwoorden zijn gebaseerd op jouw actuele website-content, niet op algemene kennis
- Betrouwbaarheid: Geen "hallucinaties" of verzonnen informatie
- Actualiteit: Na elke crawl worden de nieuwste gegevens gebruikt
- Transparantie: Bronvermeldingen tonen waar het antwoord vandaan komt
AI Modellen
De kracht achter de intelligente antwoorden
VibeChat maakt gebruik van de nieuwste generatie Large Language Models (LLM's) voor het genereren van natuurlijke, contextuele antwoorden in het Nederlands.
GPT-4o Mini
Ons primaire model is GPT-4o Mini van OpenAI, specifiek gekozen vanwege:
- Uitstekende Nederlandse taalbeheersing
- Snelle responstijden voor vlotte conversaties
- Sterke context-begrip voor complexe vragen
- Optimale balans tussen kwaliteit en kosten
Hoe werkt het model?
Het taalmodel ontvangt de vraag van de bezoeker samen met de relevante content uit jouw website (via RAG). Het model is geïnstrueerd om:
- Alleen te antwoorden op basis van de aangeleverde context
- In vriendelijke, professionele Nederlandse taal te communiceren
- Eerlijk aan te geven wanneer informatie niet beschikbaar is
- Bezoekers door te verwijzen naar relevante pagina's op je website
Training & Leren
Hoe je chatbot slimmer wordt
De chatbot "leert" op meerdere manieren om steeds betere antwoorden te geven:
Automatische Crawls
Afhankelijk van je abonnement wordt je website automatisch opnieuw geïndexeerd (dagelijks, wekelijks of maandelijks). Zo blijft de kennisbasis van je chatbot altijd actueel met de laatste wijzigingen op je website.
Handmatige Training (Q&A)
Je kunt de chatbot trainen met specifieke vraag-antwoord combinaties. Dit is ideaal voor:
- Veelgestelde vragen die niet op je website staan
- Specifieke productinformatie of prijzen
- Bedrijfsspecifieke procedures of contactgegevens
- Antwoorden die je precies zo wilt formuleren
Wanneer een vraag overeenkomt met een getrainde vraag, krijgt de bezoeker direct dat specifieke antwoord zonder dat de AI hoeft te genereren.
Document Upload (Pro & Enterprise)
Upload aanvullende documenten (TXT, DOC, DOCX) om de kennisbasis uit te breiden met informatie die niet op je website staat, zoals handleidingen, productcatalogi of FAQ-documenten.
Privacy & Beveiliging
Hoe wij omgaan met data en privacygevoelige informatie
Bij VibeChat nemen we privacy en databeveiliging zeer serieus. We zijn volledig AVG/GDPR-compliant en hanteren strikte richtlijnen voor dataverwerking.
Gecrawlde Data
- Alleen publiek toegankelijke content wordt geïndexeerd
- Beveiligde pagina's worden niet gecrawld
- Je behoudt volledige controle over welke pagina's actief zijn
Chatgesprekken
- Gesprekken worden versleuteld opgeslagen
- Automatische verwijdering na 90 dagen
- Geen doorverkoop of deling met derden
Wat als er privacygevoelige informatie is gecrawld?
Mocht er onbedoeld privacygevoelige informatie zijn geïndexeerd (bijvoorbeeld door een per ongeluk publieke pagina), dan kun je:
- De betreffende pagina deactiveren in het Pagina's overzicht
- Een handmatige re-crawl starten nadat je de bron hebt beveiligd
- Contact opnemen voor ondersteuning bij het verwijderen van specifieke data
✅ AVG-rechten: Gebruikers hebben recht op inzage, correctie, verwijdering en dataportabiliteit. Bekijk onze volledige privacyverklaring voor meer informatie.
Het Antwoordproces
Van vraag tot antwoord in milliseconden
Wanneer een bezoeker een vraag stelt aan de chatbot, doorloopt het systeem de volgende stappen:
Ontvangst & Validatie
De vraag wordt ontvangen en gecontroleerd op geldigheid.
Training Check
Het systeem controleert of er een getraind antwoord beschikbaar is.
Context Retrieval (RAG)
Relevante content wordt opgehaald uit de geïndexeerde website-pagina's en documenten.
AI Generatie
Het taalmodel formuleert een natuurlijk antwoord op basis van de context.
Streaming Response
Het antwoord wordt real-time getoond terwijl het wordt gegenereerd (streaming).
Dit hele proces duurt doorgaans slechts 1-3 seconden, afhankelijk van de complexiteit van de vraag en de hoeveelheid relevante content die moet worden doorzocht.
Veelgestelde Vragen
Kan de chatbot ook antwoorden verzinnen?
Nee, dankzij RAG-technologie baseert de chatbot zijn antwoorden uitsluitend op jouw website-content. Als de informatie niet beschikbaar is, geeft de chatbot dat eerlijk aan.
Hoe snel worden wijzigingen op mijn website overgenomen?
Na een handmatige of automatische crawl zijn de wijzigingen direct beschikbaar. Je kunt ook altijd handmatig een nieuwe crawl starten vanuit het dashboard.
Worden chatgesprekken gebruikt om de AI te trainen?
Nee, chatgesprekken worden niet gebruikt voor het trainen van AI-modellen. Ze worden alleen opgeslagen voor jouw inzicht en worden na 90 dagen automatisch verwijderd.
Wat gebeurt er met pagina's die ik deactiveer?
Gedeactiveerde pagina's worden niet meer gebruikt voor het genereren van antwoorden. De content blijft wel opgeslagen, zodat je ze later weer kunt activeren indien gewenst.
Klaar om te starten?
Probeer VibeChat en ontdek hoe een intelligente chatbot jouw website kan verrijken.