Tin tức & Thông cáo Báo chí từ Việt Nam | News & Press Releases from Vietnam

ĐỊNH HÌNH TƯƠNG LAI XỬ LÝ TÀI LIỆU: ROSSUM GIỚI THIỆU CÁC ĐỘI CHIẾN THẮNG CUỘC THI DOCILE

  • Đội sử dụng giải pháp dựa trên GraphDoc từ Đại học Khoa học và Công nghệ Trung Quốc và Viện Nghiên cứu iFLYTEK giành chiến thắng trong cuộc thi DocILE của Rossum, trưng bày các kỹ thuật đột phá trong trích xuất thông tin tài liệu.
  • Cuộc thi nhấn mạnh sự đồng bộ giữa thị giác máy tính và kiến trúc transformer, nhấn mạnh nhu cầu cần có một chiến lược toàn diện trong xử lý các tài liệu kinh doanh phức tạp.
  • Sáng kiến DocILE của Rossum kích thích sự hợp tác, đổi mới và thiết lập một thước đo toàn cầu cho Xử lý tài liệu thông minh, củng cố cam kết của công ty trong việc thúc đẩy nghiên cứu trong lĩnh vực này.

LONDON, 25 tháng 9 năm 2023 – Rossum, một nhà lãnh đạo trong ngành Xử lý tài liệu thông minh, rất vui mừng được tiết lộ những kết quả đáng chú ý của cuộc thi tiên phong DocILE (Vị trí và Trích xuất Thông tin Tài liệu). Sự kiện toàn cầu này, bắt đầu vào tháng 2 năm 2022, đã để lại dấu ấn không thể xóa nhòa trong lĩnh vực xử lý tài liệu.


Rossum là tiên phong trong Xử lý tài liệu thông minh (IDP) dựa trên đám mây, hoàn toàn thay đổi quy trình tài liệu cho các công ty. (Ảnh: PRNewsfoto/Rossum)

Rossum đã ra mắt sáng kiến DocILE vào năm 2022, cung cấp quyền truy cập vào kho tài nguyên quý giá gồm hơn 6.700 tài liệu kinh doanh được chú thích cẩn thận ngoài ra còn có 100.000 tài liệu tổng hợp.

Tập dữ liệu tiêu chuẩn chưa từng có này đã phục vụ như một thử nghiệm quan trọng cho các đội tham gia trên toàn thế giới, cho phép họ đo lường các giải pháp của mình với các phương pháp thiết lập. Trong suốt một năm, các đội đa dạng đã tận dụng tập dữ liệu này để tinh chỉnh kỹ năng của họ trong việc xác định các dữ liệu quan trọng, chẳng hạn như số VAT và địa chỉ công ty, trong các tài liệu kinh doanh bán cấu trúc.

Cuộc thi kết thúc vào ngày 24 tháng 5 năm 2023 và thu hút nhiều bài nộp đa dạng. Các đội tham gia đã thể hiện sự đổi mới của họ bằng cách tạo ra các cách tiếp cận khác nhau để giải quyết các thách thức phức tạp vốn có trong việc trích xuất thông tin tài liệu.

Một đội từ Đại học Khoa học và Công nghệ Trung Quốc và Viện Nghiên cứu iFLYTEK đã trình bày một phương pháp được gọi là ‘GraphDoc’ và giành vị trí đầu tiên bằng cách đạt được thành tích cao nhất cả trong Định vị và Trích xuất Thông tin Chìa khóa (KILE) và Nhận dạng Mục Hàng (LIR) nhiệm vụ, vượt xa các đội tham gia khác một cách đáng kể.

Thành công của họ được thúc đẩy bởi việc sử dụng đổi mới kiến trúc transformer, giúp họ có lợi thế ngay từ đầu trong cuộc thi. Họ giới thiệu một kỹ thuật đáng chú ý liên quan đến việc học cách kết hợp các từ để có giá trị trích xuất chính xác, và tận dụng các bài học dựa trên xu hướng dữ liệu để cải thiện thêm kết quả của họ.

Cuộc thi chứng kiến sự kết hợp của các phương pháp khác nhau, với một số dựa vào thị giác máy tính và những phương pháp khác dựa vào kiến trúc transformer, cho thấy sự phổ biến ngày càng tăng của kiến trúc sau trong lĩnh vực này. Quan trọng hơn, cuộc thi chứng minh rằng cần phải hiểu tài liệu đồng thời với hình ảnh và văn bản nó chứa đựng bởi vì các phương pháp thị giác máy tính thuần túy và các transformer truyền thống chỉ làm việc với văn bản không thể đạt được hiệu suất tương tự.

Bằng cách kết hợp hai cách tiếp cận này, các đội tham gia có thể đạt được sự hiểu biết sâu sắc và chính xác hơn về các tài liệu kinh doanh phức tạp, trong đó thị giác máy tính giải quyết các thách thức cụ thể trong khi các transformer xử lý các khía cạnh khác nhau. Điều này nhấn mạnh nhu cầu cần có một chiến lược toàn diện xem xét cả văn bản và cấu trúc hình ảnh của tài liệu để diễn giải chính xác.

Štěpán Šimsa, Nhà khoa học nghiên cứu tại Rossum, bày tỏ sự phấn khích về tác động của cuộc thi: “Sáng kiến DocILE không chỉ thúc đẩy nghiên cứu đột phá mà còn tạo điều kiện cho sự hợp tác và đổi mới trong ngành. Bằng cách khắc phục khoảng cách phương pháp luận, chúng tôi đang trao quyền cho cộng đồng Xử lý tài liệu thông minh phát triển các giải pháp cách mạng hóa hoạt động kinh doanh.”

Là một phần của cuộc thi, các đội tham gia phải công bố mã nguồn và xuất bản một bài báo mô tả phương pháp được áp dụng. Quỹ thưởng bao gồm 8.000 USD, trong đó 6.000 USD đã được trao cho giải pháp GraphDoc chiến thắng khi nó nhận được giải nhất cũng như giải thưởng ‘Bài báo xuất sắc nhất’.

Cuộc thi thể hiện sứ mệnh không lay chuyển của Rossum nhằm thúc đẩy sự phát triển của lĩnh vực Xử lý tài liệu thông minh trên phạm vi toàn cầu, thiết lập tiêu chuẩn cho sự hiểu biết về tài liệu. Sáng kiến này phục vụ như một chất xúc tác, kích hoạt việc tạo ra các kỹ thuật mới đổi mới nâng cao độ chính xác và hiệu quả của việc trích xuất thông tin tài liệu – minh chứng cho các giá trị cốt lõi của Rossum về sự đổi mới và xuất sắc.

Về Rossum

Rossum là nhà cung cấp hàng đầu thế giới về giải pháp Xử lý tài liệu thông minh (IDP), kết hợp khả năng trích xuất dữ liệu tiên tiến nhất trong ngành với một nền tảng mã thấp hoàn chỉnh tự động hóa một lượng lớn công việc thủ công trong quy trình xử lý tài liệu của công ty. Hàng trăm tổ chức với quy mô và ngành nghề khác nhau bao gồm Bosch, Morton Salt và Ngân hàng Tín thác Chủ của Nhật Bản sử dụng Rossum để giảm nỗ lực thủ công, cải thiện thời gian xử lý và loại bỏ lỗi. T