Trợ lý Google có thể sớm học cách nhận ra giọng nói của bạn


9to5Google đã phát hiện ra các chuỗi mã ẩn trong các lần lặp lại gần đây của ứng dụng Google có thể cho thấy một cải tiến lớn sắp đến với Trợ lý Google. Đã được nhiều người coi là trợ lý kỹ thuật số tốt nhất được cung cấp trên các thiết bị hiện nay, mã do 9to5Google phát hiện dường như thảo luận về một hệ thống nhận dạng giọng nói cho phép Trợ lý nhận dạng giọng nói của bạn.

Các chuỗi mã liên quan đến “Nhận dạng giọng nói được cá nhân hóa” có thể xuất hiện trong cài đặt Trợ lý Google với nội dung mô tả “Lưu trữ các bản ghi âm trên thiết bị này để giúp Trợ lý Google nhận dạng tốt hơn những gì bạn nói. Âm thanh vẫn ở trên thiết bị này và có thể bị xóa bất kỳ lúc nào bằng cách tắt nhận dạng giọng nói được cá nhân hóa. Tìm hiểu thêm. ”

Google muốn Trợ lý nhận diện giọng nói của bạn tốt hơn

Google đã có một bài viết hỗ trợ về cái được gọi là “học máy“. Trang hỗ trợ cho biết “Học máy là một công nghệ nâng cao quyền riêng tư mà chúng tôi sử dụng để cải thiện các mô hình trên thiết bị mà không cần gửi dữ liệu thô của người dùng tới máy chủ của Google . Trợ lý Google sử dụng học máy để cải thiện” Hey Google “. Khi bạn hỏi,” Này Google, thời tiết ngày mai thế nào? “, Một kiểu máy trên thiết bị sẽ phát hiện ra rằng bạn đã nói” Hey Google “, sau đó gửi truy vấn của bạn tới Trợ lý Google.”

Google lưu ý rằng “mô hình này có thể kích hoạt khi bạn không có ý định, chẳng hạn như nếu có tiếng ồn giống như ‘Này Google’.” Ngoài ra, nó có thể không kích hoạt khi bạn nói ‘Hey Google.’ Giờ đây, chúng tôi sử dụng tính năng học tập được liên kết để tinh chỉnh mô hình ‘Hey Google’ và cố gắng giảm tình trạng nhầm lẫn và bỏ sót. ”

Học giọng nói của bạn có thể giúp Trợ lý Google phiên âm chính xác hơn một số cụm từ phổ biến mà bạn thường nói và các địa chỉ liên hệ mà bạn nhắc đến nhiều nhất. Trên một số thiết bị gia đình thông minh của Google như Nest Hub thế hệ thứ 2 và Mini, Google sử dụng chip học máy xử lý các truy vấn và tác vụ mà bạn phát âm nhiều nhất để Trợ lý cung cấp “thời gian phản hồi nhanh hơn nhiều”.

Google có thể đang tìm cách mở rộng khả năng này từ các thiết bị gia đình thông minh sang các sản phẩm di động hỗ trợ Android của bạn bằng cách yêu cầu bạn chọn tham gia nếu quan tâm,. Các tệp sẽ ở trên thiết bị của bạn cho đến khi bạn tắt hệ thống

Gần đây, bạn có thể nhận thấy rằng khi gọi điện cho các công ty phát hành thẻ tín dụng của bạn, một số người hiện chỉ ra rằng họ đang thu mẫu giọng nói của bạn để khớp với các cuộc gọi điện thoại trong tương lai vì mục đích bảo mật. Ngoài ra, Google cũng lưu ý rằng “Nếu bạn tắt tính năng này, Trợ lý của bạn sẽ kém chính xác hơn trong việc nhận dạng tên và các từ khác mà bạn thường nói. Tất cả âm thanh được sử dụng để cải thiện khả năng nhận dạng giọng nói cho bạn sẽ bị xóa khỏi thiết bị này.”

Tất cả là một phần trong nỗ lực của Google nhằm cho phép người dùng trò chuyện tự nhiên hơn với Trợ lý Google bắt đầu từ năm sau. Tại Google I/O 2022, công ty đã tiết lộ rằng Trợ lý sẽ có thể duy trì cuộc trò chuyện đơn giản bằng cách “giao tiếp bằng mắt” để mọi thứ có thể hoàn thành mà không cần phải nói từ nóng “Hey Google”.

Google đang có kế hoạch thêm tính năng Cụm từ nhanh vào Nest Hub Max

Như nhiều người dùng dòng Pixel 6 trong số các bạn đã biết, một số hành động nhất định được gọi là Cụm từ nhanh có thể được nói với Trợ lý Google để thực hiện các tác vụ mà không cần phải nói “Hey Google” trước. Các nhiệm vụ này bao gồm:

  • Đặt hẹn giờ hoặc báo thức
  • Hỏi thời gian
  • Bật hoặc tắt đèn
  • Hủy hẹn giờ hoặc báo thức
  • Làm mờ hoặc làm sáng đèn
  • Hỏi thời tiết

Vào mùa hè này, Google được cho là có kế hoạch thêm cụm từ nhanh vào Nest Hub Max.