Ses Ayarları
Müşteri yapay zeka olduğunu fark etmeden konuşabiliyorsa, bunun yarısı prompt’tan, yarısı sesten gelir: doğru sağlayıcı, doğal hız, yerinde dolgu sesleri ve hafif bir ortam sesi büyük fark yaratır. Ses ayarları her asistanın detay sayfasında bulunur.
Ses sağlayıcı (provider)
| Sağlayıcı | Güçlü yanı | Ne zaman |
|---|---|---|
| ElevenLabs (varsayılan) | Türkçe’de en doğal tonlama, duygu, akıcılık | Çoğu Türkçe görüşme için ilk tercih |
| OpenAI | Tutarlı, hızlı, geniş dil desteği | Çok dilli görüşmeler, ElevenLabs kotası dolarsa |
| Cartesia | Çok düşük gecikme (latency), hızlı yanıt | Gecikmenin kritik olduğu, kesintili diyaloglar |
Ana sağlayıcının yanında bir TTS yedeği (fallback) ayarlayabilirsin — ana sağlayıcı yanıt vermezse görüşme kesilmez, yedek devreye girer.
Ses (voice)
Her sağlayıcının kendi ses kütüphanesi var. Seçim ipuçları:
- Birden çok ses dene. Aynı prompt’u 2-3 farklı sesle test ara, hangisi markana ve hedef kitlene uyuyor onu bırak.
- Cinsiyet & yaş tonu — ürününe/sektörüne göre: enerjik genç ton mu, sakin güven veren ton mu?
- Tutarlılık — bir asistanın sesini canlıya aldıktan sonra sık değiştirme; müşteriler sesi tanır.
- ElevenLabs için
voiceId, Cartesia içincartesiaVoiceIdalanları ilgili sesin kimliğini tutar.
📸 [Ekran görüntüsü: Asistan ses ayarları paneli — provider + voice seçimi + dinleme]
İnce ayarlar: hız, kararlılık, stil
| Ayar | Ne yapar | Öneri |
|---|---|---|
| Hız (voiceSpeed) | Konuşma temposu (≈1.0 = normal). Yüksek = hızlı/aceleci, düşük = ağır/sakin. | 0.95–1.05 arası başla; çok hızlıysa müşteri yetişemez, çok yavaşsa sıkıcı olur. |
| Kararlılık (voiceStability) | Tonlamanın ne kadar “düz” vs “değişken” olduğu. Yüksek = monoton ama tutarlı; düşük = ifade dolu ama bazen kararsız. | ~0.5 dengeli. Satış/enerjik için biraz düşür; ciddi/kurumsal için biraz yükselt. |
| Stil (voiceStyle) | Sesin “karakterini” abartma derecesi (sağlayıcıya göre değişir). | ~0.4. Çok yükseltirsen yapay/abartılı duyulabilir. |
Bu üç ayarı tek seferde uçtan uca çevirme — küçük adımlarla değiştir, her değişiklikten sonra bir test araması yap. “İyi ses” çoğu zaman ince ayarın değil, doğru voice + makul hızın sonucudur.
Dolgu sesleri (fillers)
İnsanlar konuşurken “ee”, “şey”, “yani”, “bir saniye” der. Asistan da bunları kullanınca robotik hissi kırılır.
- Dolgu sesleri açık (fillerSoundsEnabled) — bu özelliği aç/kapa.
- Dolgu modu (fillerMode) —
text(dil modeli metne dolgu kelimeler ekler) veya ses modu. - Bağlama göre dolgu listeleri — dört ayrı liste özelleştirilebilir:
- Pozitif (positiveFillers) — “harika”, “çok güzel”, “anladım”
- Negatif (negativeFillers) — “hmm, anlıyorum”, “evet, haklısınız”
- Soru (questioningFillers) — “şöyle sorayım”, “merak ettim”
- Nötr (neutralFillers) — “tamam”, “peki”, “şimdi”
- Geri kanal (backchannelEnabled) — müşteri konuşurken “hı hı”, “evet, dinliyorum” gibi kısa onaylar; dinlediğini hissettirir.
Aşırıya kaçma — her cümleye dolgu eklenmiş bir asistan da yapay duyulur. Listeleri kısa ve doğal tut.
Ortam sesi (ambient)
Tamamen sessiz bir ortamda konuşan ses, bazen “stüdyo kaydı” gibi yapay durur. Hafif bir arka plan gerçekçilik katar:
- Ortam sesi açık (ambientSoundEnabled) — aç/kapa.
- Ortam tipi (ambientSoundType) — örn.
office(hafif ofis uğultusu), vb. - Ortam ses seviyesi (ambientSoundVolume) — çok düşük tut (≈0.05–0.10). Müşterinin konuşmasını bastırmamalı; “var ama dikkat çekmiyor” seviyesi ideal.
Telaffuz sözlüğü (pronunciation dictionary)
Marka adın, ürün isimlerin, kısaltmalar yanlış okunuyorsa, telaffuz sözlüğüne doğru okunuşunu tanımlarsın. Örnekler:
Purvisor→ “pörvayzır” (İngilizce okunuş istiyorsan) veya “purvisor” (Türkçe)KVKK→ “ka ve ka ka” (harf harf) yerine doğru telaffuz- Ürün/şirket özel isimleri
Bu, asistanın görüşmede o kelimeleri her seferinde doğru söylemesini sağlar.
Gürültü engelleme & DTMF
- Gürültü engelleme (noise_cancellation) — karşı taraftaki arka plan gürültüsünü (trafik, kalabalık, TV) bastırır, asistan müşteriyi daha net duyar. Genelde açık tutulur.
- DTMF algılama (dtmfDetection) — müşteri tuşa bastığında (IVR tarzı “1’e basın” akışları için) algılama. Klasik bir tuş menüsü kurmuyorsan kapalı bırakabilirsin.
Hızlı kontrol listesi
- Sağlayıcı seçildi (Türkçe için ElevenLabs öneri) + TTS yedeği ayarlı
- 2-3 ses denendi, en uygunu bırakıldı
- Hız 0.95–1.05 aralığında, test edildi
- Kararlılık/stil makul (0.5 / 0.4 civarı), abartılı değil
- Dolgu sesleri açık, listeler kısa ve doğal
- Ortam sesi açık ama çok düşük seviyede (≈0.08)
- Marka/kısaltma isimleri telaffuz sözlüğünde
- Gürültü engelleme açık
- En az 1 gerçek telefon araması ile uçtan uca dinlendi
İlgili
- Asistan Oluşturma — tüm asistan alanlarına genel bakış
- Prompt Yazma Rehberi — sesin yarısı buradan gelir
- Gelişmiş Ayarlar — emotion detection, adaptive personality (Faz 2)