การรู้จำเสียงด้วย AI ขั้นสูงด้วย Conformer-2
Conformer-2 เป็นโมเดลการรู้จำเสียงพูดอัตโนมัติ (ASR) ที่มีนวัตกรรมซึ่งพัฒนาความสามารถในการรู้จำเสียงพูดผ่านการปรับปรุงที่สำคัญเหนือกว่า Conformer-1 มันโดดเด่นในการถอดรหัสชื่อเฉพาะและอัลฟานิวเมอริกได้อย่างถูกต้อง แม้ในสภาพแวดล้อมที่มีเสียงรบกวนที่ท้าทาย ขอบคุณการฝึกอบรมที่กว้างขวางบนข้อมูลเสียงภาษาอังกฤษจำนวน 1.1 ล้านชั่วโมง ประสิทธิภาพที่แข็งแกร่งของโมเดลได้รับการสนับสนุนจากท่อส่งข้อมูลที่ปรับปรุงซึ่งช่วยลดความล่าช้า ทำให้สามารถตอบสนองได้เร็วขึ้นโดยไม่สูญเสียความแม่นยำ
ความก้าวหน้าใน Conformer-2 มาจากวิธีการฝึกอบรมที่มีนวัตกรรมซึ่งใช้ 'ครู' หลายคนในการสร้างป้ายชื่อ นำไปสู่โมเดลที่มีความทนทานต่อความล้มเหลวของแต่ละบุคคล นอกจากนี้ การขยายข้อมูลและพารามิเตอร์ของโมเดลยังสอดคล้องกับข้อมูลเชิงลึกจากเอกสาร 'Chinchilla' ทำให้ Conformer-2 สามารถบรรลุความเร็วในการประมวลผลที่เร็วขึ้นในขณะที่ยังคงต้นทุนที่ต่ำกว่า สิ่งนี้ทำให้มันเป็นโซลูชันชั้นนำในหมวดการสร้างเสียง AI.