MSTEST — Voice Agent Latency

Gemini Live · waiting…
Voice-to-Voice Latency (industry standard, π.χ. Telnyx/Vapi)
Τελευταία απάντηση — από σιωπή σε φωνή (local VAD)
Μ.Ο. ανά απάντηση
— turns · current agent
Σύνολο session
άθροισμα όλων των turns

Talk

Click to start a session.

Live pipeline stages

Mic Detect
Silence
STT final
Brain req
Brain TTFT
TTS audio
Δείχνει τα στάδια live καθώς συμβαίνουν. ms = από VAD speech_ended.

Live transcript

Waiting for speech…

This sentence

E2E (ακούει → απαντάει)
last_audio → first audio
Σύνολο turn
total_turn_ms
Μ.Ο. E2E (αυτός ο agent)
από history
no data

Per-word timing (from first output chunk)

no data

Comparison summary

Agent Turns Best E2E Mean E2E Median E2E P95 E2E Avg score
no data yet

History

When Agent You said Reply last_audio→audio in→audio total Score Judge reason

Ask the assistant (Gemini 3.5 Flash, ξέρει τα πιο πρόσφατα turns)

Ρώτα οτιδήποτε. Π.χ. «γιατί ο pipeline είναι πιο αργός;», «τι σημαίνει deepgram_final;», «πώς να μειώσω το E2E;»