Giải Pháp Đột Phá Chuyển Đổi Bảng Biểu Từ Ảnh Sang Excel Với Tốc Độ 40 Khung Hình/ Giây
Một kỹ sư Việt Nam đã phát triển một giải pháp công nghệ tiên tiến cho phép chuyển đổi bảng biểu từ hình ảnh sang file Excel chỉ trong vòng chưa đầy 2 giây. Giải pháp này đạt tốc độ nhận diện 40 khung hình mỗi giây và chỉ chênh lệch 2% so với dữ liệu gốc, đảm bảo độ chính xác cao trong quá trình chuyển đổi.
Tại hội nghị chuyên đề về trí tuệ nhân tạo ECAI 2024, diễn ra vào cuối tuần qua tại Tây Ban Nha, Viettel AI đã giới thiệu công nghệ này, thu hút sự chú ý của các chuyên gia và doanh nghiệp trong lĩnh vực công nghệ thông tin. Giải pháp nhận diện và trích xuất thông tin từ bảng biểu không chỉ nhanh chóng mà còn có khả năng xuất cấu trúc và dữ liệu từ bảng biểu trong thời gian thực, nhanh gấp bốn lần so với những công nghệ hiện có trên thị trường.
Việc sử dụng công nghệ để tự động hóa quy trình nhận diện và trích xuất văn bản từ hình ảnh không phải là điều mới mẻ, với sự hỗ trợ của các công nghệ như OCR (Nhận dạng ký tự quang học) và trí tuệ nhân tạo (AI). Tuy nhiên, trong nhiều năm qua, thách thức lớn đối với các giải pháp này là khả năng xử lý nhanh chóng các hình ảnh chứa bảng biểu. Điều này xuất phát từ sự đa dạng trong cấu trúc của các bảng biểu, chẳng hạn như bảng không có viền, tồn tại nhiều ô trống, và kích thước của các ô không đồng đều.
- AI Contact Center OmiCX lọt vào danh sách 14 giải pháp AI sáng tạo hàng đầu
- Ứng dụng gọi xe tích hợp hơn 200 hãng taxi Việt Nam
- Sinh viên Việt Nam xuất sắc giành giải nhất với sáng kiến drone hỗ trợ cứu hộ trong thiên tai
- Apple chính thức phát hành iOS 18.1 với tính năng ghi âm cuộc gọi trên iPhone
- Mỹ chuẩn bị quy định hạn chế đầu tư vào AI tại Trung Quốc vì lý do an ninh quốc gia
Đại diện của Viettel AI đã chỉ ra rằng, mặc dù công nghệ đã xử lý chữ viết một cách hiệu quả, nhưng việc trích xuất thông tin chính xác từ các bảng biểu trong tài liệu vẫn là một bài toán khó khăn. “Tự động hóa quy trình này không chỉ giảm bớt khối lượng công việc nhập liệu thủ công mà còn nâng cao độ chính xác và tốc độ xử lý văn bản,” họ cho biết.
Nhóm nghiên cứu đã tìm ra cách để tối giản quy trình xử lý, biến nó thành một giai đoạn thay vì nhiều giai đoạn như phương pháp truyền thống. Điều này cho phép họ xử lý các bảng biểu có nhiều hàng và cột nhanh hơn. Hơn nữa, giải pháp này cũng giúp giảm độ phức tạp trong quy trình xử lý, tiết kiệm bộ nhớ và đơn giản hóa quy trình huấn luyện mô hình AI. Theo công bố tại hội nghị ECAI, giải pháp do các kỹ sư Việt Nam phát triển có khả năng trích xuất dữ liệu với tốc độ lên đến 40 khung hình mỗi giây trong một số trường hợp, với độ sai lệch dữ liệu chỉ khoảng 2% so với dữ liệu chuẩn.
Các chuyên gia nhận định rằng hiệu quả của công nghệ mới này sẽ cần được đánh giá thêm thông qua quá trình sử dụng thực tế. Trong các thử nghiệm với hình ảnh có chứa hai bảng biểu, giải pháp đã cho phép xuất dữ liệu với cấu trúc bảng ngay lập tức, đảm bảo tính chính xác của cấu trúc và số liệu. Tuy nhiên, vẫn tồn tại một số điểm cần cải thiện, chẳng hạn như dấu “>=” trong cách diễn đạt thông thường chưa được tái hiện một cách chính xác.
Đại diện của nhóm nghiên cứu cho biết công nghệ này đã được tích hợp vào giải pháp xử lý hồ sơ thông minh Viettel IDP. Giải pháp này có khả năng tự động tách thông tin từ hình ảnh với tốc độ dưới 2 giây mỗi trang tài liệu, nhanh gấp 60-80 lần so với phương pháp nhập liệu thủ công, đạt độ chính xác 90%, từ đó giúp người dùng tiết kiệm tới 80% thời gian phê duyệt hồ sơ.
“Công nghệ được giới thiệu tại Hội nghị ECAI 2024 là một bước quan trọng trong nỗ lực nâng cao tốc độ xử lý của giải pháp, với mục tiêu không chỉ dừng lại ở việc xử lý thông tin trong vòng hai giây mà hướng tới khả năng thực hiện ngay lập tức,” đại diện nhóm cho biết thêm.