{ "hq": [ { "speaker": 0, "text": "Hello? Hello? Hello? Hello?", "start": 0.16, "end": 3.3 } ] }