{ "hq": [ { "speaker": 0, "text": "1, 2, 3.", "start": 2.3999999, "end": 3.54 } ] }