Gán nhãn

Công cụ gán nhãn

Nâng cấp vấn đề xương sống của dự án gán nhãn dữ liệu.

Loại dự án TagOn đáp ứng

TagOn đáp ứng bao gồm không giới hạn các loại dự án từ gán nhãn hình ảnh & video, âm thanh, văn bản, LiDAR. Hiện tại bộ công cụ đã được phát triển để phục vụ 16 loại dự án gán nhãn nhãn dữ liệu, đáp ứng mọi nhu cầu mở rộng của doanh nghiệp.
Phát triển thuật toán thị giác máy tính một cách toàn diện với công cụ gán nhãn hoàn hảo trên từng khung hình và pixel. Dịch vụ gán nhãn hình ảnh và video của TagOn hỗ trợ đa dạng các yêu cầu, từ phát hiện ung thư đến xe tự lái,...
  • project-types
    Gán thông tin/nhãn mang nhiều ý nghĩa lên hình ảnh trên quy mô lớn để tăng tốc việc đào tạo học máy (Machine Learning).
  • Choosing platform is important to a image annotation project
    Bằng việc xác định chính xác một hoặc nhiều đối tượng, từ đó gán nhãn trên tập dữ liệu ảnh, TagOn giúp đẩy nhanh việc đào tạo AI trong những tác vụ phân biệt đối tượng, nét mặt, cảnh vật,...
    Tác vụ phát hiện đối tượng đặc biệt hiệu quả khi được áp dụng với khối lượng dữ liệu lớn, chẳng hạn như trong Chụp cộng hưởng từ (MRI) với dữ liệu đa khung để nhận dạng đặc điểm và theo dõi thay đổi theo thời gian.
  • Phân vùng toàn bộ ảnh và xác định các đối tượng được hiển thị theo cấp độ vật thể, thể hiện dưới dạng các nhóm đối tượng và khu vực cùng loại. Phân vùng hình ảnh được chia thành 2 dạng:

    - Phân vùng ngữ nghĩa (semantic segmentation): Phân vùng tất cả các pixel có liên quan theo từng lớp. Phân vùng ngữ nghĩa được ứng dụng cho những trường hợp không cần đến tác vụ đếm hoặc theo dõi vật thể qua các khung hình

    - Phân vùng đối tượng (Instance segmentation): Phân vùng từng đối tượng một cách riêng biệt mà không đưa nó vào bất kỳ lớp nào. Phân vùng đối tượng tách biệt các đối tượng chồng chéo hoặc rất giống nhau dựa trên đường viền của chính đối tượng, thích hợp cho việc xác định vị trí, số lượng, kích thước và hình dạng của các đối tượng.
  • O
    Trích xuất văn bản, ký tự từ các văn bản chữ in hoặc văn bản viết tay. Với đội ngũ gán nhãn rộng lớn phủ khắp hơn 20 quốc gia, TagOn mang đến dịch vụ OCR cho hơn 50 ngôn ngữ và phương ngữ.
    Hệ thống của TagOn hỗ trợ phong phú các định dạng văn bản, từ mã vạch đến văn bản in tay (ICR), hộp kiểm (OMR),...
  • Theo dõi chính xác chuyển động của các đối tượng theo thời gian và không gian với dịch vụ gán nhãn video chi tiết từng khung hình. TagOn mang đến giải pháp kết hợp giữa người gán nhãn và công cụ gán nhãn tự động để tiết kiệm thời gian và chi phí, đặc biệt với những dự án gán nhãn video phức tạp. Theo dõi đối tượng được ứng dụng mạnh mẽ trong phát triển robot sản xuất, xe tự lái,...
Thúc đẩy sự phát triển của chatbot, trợ lý ảo, công cụ chuyển văn bản thành giọng nói và những công nghệ xử lý ngôn ngữ tự nhiên (NLP) khác với công cụ gán nhãn âm thanh vượt bậc và cộng đồng annotator từ khắp mọi nơi
  • tagon-audio-classification
    Nghe và phân tích các bản ghi âm để phân loại âm thanh dựa trên ngôn ngữ, phương ngữ, nội dung, ngữ nghĩa và các yếu tố khác. TagOn tự hào với đội ngũ annotator khổng lồ, đảm bảo tùy chỉnh chính xác theo mọi yêu cầu của doanh nghiệp cho từng dự án gán nhãn.
  • Các luồng ghi âm, thường chứa nhiều loại âm thanh khác nhau (thậm chí là chồng chéo lên nhau), được chia chính xác thành các phân đoạn đồng nhất để được gán nhãn một cách chi tiết, tương ứng với từng nguồn phát âm riêng. TagOn mang đến dữ liệu có độ chính xác cao nhất bằng việc cẩn trọng trong chọn lọc thuật toán từ những khâu đầu tiên cũng như giám sát chặt chẽ, đảm bảo ít sai sót nhất đến những bản dữ liệu cuối cùng.
  • tagon-
    TagOn cung cấp giải pháp mang tính bản địa cao để nắm được bất kỳ nội dung âm thanh nào. Annotator của TagOn có đảm bảo khả năng xử lý trôi chảy các giọng phức tạp, phương ngữ từ hơn 20 quốc gia với hàng nghìn đặc điểm địa lý. Bên cạnh đó, việc kết hợp cả công cụ gán nhãn AI và người gán nhãn còn giúp tối ưu hóa thời gian và chi phí, đồng thời duy trì tỷ lệ chính xác cao của kết quả phiên âm.
Đẩy mạnh việc đào tạo Xử lý ngôn ngữ tự nhiên (NLP) và thị giác máy tính (computer vision) với dịch vụ gán nhãn văn bản tiên tiến dành cho đa ngôn ngữ, chính xác đến cấp độ từng ký tự.
  • Phân loại các tài liệu một cách kỹ lưỡng vào các lớp, danh mục liên quan, có ý nghĩa. Annotator của TagOn sẽ gắn thẻ các lớp thích hợp từ tập hợp các nhãn lên tài liệu, giúp đơn giản hóa và quy trình hóa quá trình sắp xếp, lưu trữ tài liệu và dữ liệu. TagOn giúp cho công việc quản lý văn bản và lượng lớn thông tin lộn xộn cho các dự án dữ liệu khổng lồ không còn là một vấn đề đáng lo ngại.
  • TagOn tuyển dụng những annotator lành nghề nhất để xác định và phân loại chính xác những thông tin chính - các đối tượng ký tự - trong văn bản. Không chỉ mang đến kết quả gán nhãn chất lượng cao nhất, TagOn còn đảm bảo đáp ứng được đa dạng các dự án khác nhau, từ dự án về nhân sự đến phân loại nội dung, công cụ tìm kiếm và đề xuất,...
  • Cẩn thận lựa chọn annotator theo yêu cầu cụ thể của từng dự án, TagOn tạo câu trả lời bằng cách truy vấn cơ sở kiến ​​thức (cơ sở dữ liệu thông tin có cấu trúc) hoặc bộ dữ liệu ngôn ngữ tự nhiên phi cấu trúc. Dịch vụ trả lời câu hỏi của TagOn giải quyết đa dạng các loại câu hỏi, chẳng hạn như câu hỏi liên quan đến sự thật, danh sách, định nghĩa, câu hỏi giả định, các câu hỏi hạn chế về mặt ngữ nghĩa và câu hỏi trộn ngôn ngữ.
  • TagOn cô đọng lượng thông tin khổng lồ thành các bản tóm tắt ngắn gọn, trôi chảy trong khi vẫn giữ được ý nghĩa của tài liệu văn bản gốc. Bên cạnh đó, dịch vụ của TagOn có thể đáp ứng các dự án tóm tắt yêu cầu cao như viết lại đoạn (paraphrase), khái quát hóa và ngôn ngữ thường nhật
Giải quyết một trong những vấn đề phức tạp nhất của thị giác máy tính: dữ liệu đám mây điểm LiDAR (point-cloud) với những công cụ gán nhãn tiên tiến, đảm bảo độ chính xác đến từng điểm, thực hiện dự án lên tới hơn 100 nghìn điểm cho mỗi tác vụ.

  • Cung cấp dịch vụ nhận dạng đối tượng chính xác cho dữ liệu point-cloud LiDAR với annotator trình độ cao để nắm bắt chính xác kích thước, vị trí và hướng của đối tượng mục tiêu. Bằng việc áp dụng khung tọa độ LiDAR và hình hộp 3d có hương, TagOn giúp doanh nghiệp nhanh chóng đạt được những áp dụng thực tế và dữ liệu đưa vào đào tạo.
  • Optical Character Recognition (OCR) - A type of image annotation project
    Phân vùng từng điểm của các đám mây điểm 3D để tách các đối tượng và khu vực 3D như tòa nhà, ô tô, người, nền,... TagOn tối ưu hóa quy trình bằng cách sử dụng cấu trúc phân vùng coarse-to-fine để truy cập toàn bộ đám mây điểm như một đầu vào duy nhất và gán mỗi điểm cho mỗi lớp.

    TagOn tận dụng RECM để phân loại trước các điểm trên mặt đất hoặc các điểm chướng ngại vật. Đám mây điểm sau đó được chuyển sang định dạng hình ảnh RGB, giá trị pixel được khởi tạo dựa trên kết quả phân vùng thô để tạo ra "Hình ảnh chướng ngại vật trên mặt đất". Cuối cùng, JCP được sử dụng để phân lại "điểm có độ tin cậy thấp" - điểm giao nhau giữa kênh xanh lá và kênh đỏ sau khi đảm bảo lan tỏa độ tin cậy - và tối ưu hóa kết quả phân đoạn
  • Nhận dạng và theo dõi đối tượng một cách chính xác theo từng khung hình trong đám mây điểm 3D. Dịch vụ của TagOn cho phép theo dõi nhiều đối tượng bằng cách cung cấp ID duy nhất cho từng đối tượng, kết hợp với khả năng tính toán nâng cao. Bên cạnh hình hợp 3D, TagOn còn sử dụng 6 bậc tự do (6 degrees of freedom) với góc dọc, góc ngang và góc nghiêng giúp mang đến kết quả gán nhãn chất lượng nhất.

Công cụ gánnhãn

Đẩy nhanh quá trình đào tạo các mô hình cho máy học (Machine Learning) bằng cách sử dụng kết hợp công cụ gán nhãn tự động và công cụ cho con người.
  • provide-content
    Hình ảnh Video

    Hình hộp chữ nhật/Hình hộp 2D

    Sử dụng hình chữ nhật để bao quanh đối tượng trong hình ảnh hoặc video. Tác vụ sử dụng hình hộp thường được yêu cầu vẽ càng sát với các cạnh vật thể càng tốt.

     

    Sử dụng: Cho những dự án không chú trọng hình dạng của vật thể

     

    Ưu điểm:

    • Vẽ đơn giản và nhanh chóng, tiết kiệm thời gian cho các dự án có khối lượng dữ liệu lớn.
    • Một trong những công cụ phổ biến và xử lý tốn ít chi phí nhất

     

    Nhược điểm:

    • Chỉ được giới hạn trong vẽ hình chữ nhật hoặc hình vuông
    • Không thể chỉ vẽ chính xác pixel của đối tượng mà phải bao gồm nền, các bộ phận của vật khác,…
    • Không phù hợp với những đối tượng bị lẫn với nhau hoặc bị che/cắt
  • Hình ảnh Video

    Đa giác

    Hình được hình thành từ các đường thẳng bao quanh viền đối tượng, nối với nhau bởi các dấu chấm. Các công cụ đa giác cho phép ôm sát vào hình dạng của vật thể và loại bỏ những phần không liên quan mà các công cụ chú thích khác có thể bao gồm.

     

    Sử dụng: Được sử dụng trong các trường hợp đối tượng có hình dạng (vũng nước, vùng đất,…), kích thước hoặc hướng bất thường, không vừa với hình hộp chữ nhật hoặc dự án yêu cầu gán nhãn với độ chính xác cao hơn hình hộp chữ nhật.

     

    Ưu điểm

    • Cực kỳ hữu ích cho các dự án có các vật thể phức tạp có hình dạng bất thường.
    • Có thể tạo được gán nhãn chi tiết đến từng pixel

     

    Nhược điểm

    • Tốn nhiều thời gian hơn để gán nhãn so với các công cụ hình hộp chữ nhật
    • Những vật thể chứa quá nhiều điểm có thể tạo ra độ trễ khi tính toán.
  • Hình ảnh Video

    Đường gấp khúc

    Được tạo bởi các đường và các hàm nối trục một cách đơn giản để phát hiện và xác định các đường viền vật thể bằng cách vẽ các đường xung quanh đường biên cần thiết.

     

    Sử dụng: Thường được sử dụng để gán nhãn các hình mở, không có điểm bắt đầu hay kết thúc từ cùng một vị trí như vạch kẻ đường, đường dây điện hoặc vỉa hè.

     

    Ưu điểm

    • Khác với hình hộp chữ nhật, polyline có thể tránh việc tạo ra các vùng trống và bao gồm các pixel không cần thiết.
    • Thích hợp cho các đối tượng không có độ dày như quỹ đạo hoặc điểm giữa.

     

    Nhược điểm

    • Đa số chỉ được sử dụng với những dự án đường viền dày xấp xỉ 1 pixel. Nếu các đường dày hơn, công cụ đa giác có thể được sử dụng để bao gồm cả thông tin chiều rộng.
  • Hình ảnh Video

    Điểm/Chấm/Mốc

    Annotator đặt các dấu chấm hoặc điểm mốc trên toàn ảnh để xác định các đối tượng và hình dạng của chúng, đôi khi các dấu chấm lớn hơn được sử dụng cho các khu vực quan trọng hơn.

     

    Sử dụng: Công cụ đặc biệt hữu ích với các dự án cần xác định từng pixel một trên anhe (hoặc video) hoặc yêu cầu đếm các vật thể

     

    Ưu điểm

    • Công cụ đơn giản nhất để sử dụng cũng như xử lý tính toán
    • Dễ dàng đếm các đối tượng trong một nhóm như đếm người trong đám đông hoặc xe cộ trên đường.

     

    Nhược điểm

    • Cần phóng to tối đa hình ảnh đến mức pixel để đảm bảo chính xác vị trí gán nhãn
  • Hình ảnh Video

    Key Points

    Bao gồm một loạt các điểm (keypoint), được nối với nhau bằng các đường. Công cụ TagOn cung cấp khung keypoint được định hình trước cho các dự án phổ biến như khung xương người, biểu cảm khuôn mặt, v.v.

     

    Sử dụng: Hữu ích cho việc theo dõi và dự đoán chuyển động, theo dõi sự khác nhau giữa các đối tượng có cấu trúc giống nhau (ví dụ: hình người và đặc điểm khuôn mặt). Do đó, keypoint thường được sử dụng trong nhận dạng khuôn mặt, nhận dạng các bộ phận cơ thể, tư thế và cảm xúc trên khuôn mặt.

     

    Ưu điểm

    • Việc sử dụng các khung keypoint đã được định hình của TagOn giúp cho dự án trở nên nhanh chóng và đơn giản: Người gán nhãn chỉ cần căn chỉnh điểm để khớp với đối tượng.
    • Đảm bảo rằng không có nút nào trong chuỗi bị bỏ qua.

     

    Nhược điểm

    • Chỉ hữu ích cho các đối tượng có cùng cấu trúc thông thường, được xác định
    • Có thể gây nhầm lẫn cho người gán nhãn khi các điểm của đối tượng không hiển thị hoặc bị ẩn.
  • Hình ảnh Video

    Hình hộp 3D

    Hình hộp 3d bao quanh các đối tượng và hiển thị thêm thông tin chiều sâu, cho phép các thuật toán thị giác máy tính diễn giải độ dày và hướng của đối tượng. Đối với người gán nhãn, tác vụ vẽ hình hộp 3D đòi hỏi đặt 2 hình chữ nhật (mặt trước và mặt sau) vào hình ảnh ứng với vật thể, 2 hình từ đó sẽ tự động kết nối để tạo ra một hình khối 3D.

     

    Sử dụng: Được sử dụng khi thông tin chiều sâu là quan trọng, có thể được áp dụng trong nhiều ngành công nghiệp: phát hiện cấu trúc 3D trong không gian địa lý, theo dõi phương tiện với dữ liệu đám mây điểm LiDAR, phân tích CT và MRI trong y tế,…

     

    Ưu điểm

    • Cung cấp thêm thông tin về độ sâu của đối tượng thay vì chỉ chiều dài và chiều rộng trong các hộp giới hạn 2D.

     

    Nhược điểm

    • Tốn thời gian, đòi hỏi nhiều kỹ năng vẽ và yêu cầu mức độ tính toán cao hơn để xử lý một lượng lớn dữ liệu
  • Audio

    Phân đoạn âm thanh

    Chia bản ghi âm thành các phần nhỏ để dễ dàng gán nhãn dữ liệu ở độ chính xác cao nhất.

  • Văn bản

    Phân đoạn văn bản

    Dễ dàng đánh dấu các thành phần tài liệu (từ khóa, cụm từ hoặc câu) cùng với các thẻ để thêm ý nghĩa cho dữ liệu văn bản.

  • LiDAR

    Hình hộp 3D LiDAR

    Hộp 3D bao bọc các đối tượng trên từng pixel để xác định và theo dõi chính xác các đối tượng trong dữ liệu LiDAR

  • LiDAR

    Phân vùng LiDAR

    Tạo một layer phân vùng trên ảnh LiDAR với độ chính xác cao đến từng đám mây điểm

  • Annotation Tools
    Công cụ hỗ trợ

    Tự động phân vùng

    Sử dụng các công cụ AI được phát triển sẵn để gán nhãn nhanh những hình ảnh và video phức tạp. Công cụ của TagOn đảm bảo độ chính xác với tính năng phân vùng cạnh tự động chi tiết đến cấp độ pixel.

  • Công cụ hỗ trợ

    Thước kẻ

    Tính toán khoảng cách trong hình ảnh theo pixel để xác định các tính năng của đối tượng và điều chỉnh theo yêu cầu của khách hàng

  • Data Annotation
    Công cụ hỗ trợ

    Pathfinder - Hợp nhất

    Tạo một hình dạng phức hợp bằng cách kết hợp tất cả các hình dạng đã chọn thành một hình dạng chung.

  • Công cụ hỗ trợ

    Pathfinder - Cắt (mặt trước hoặc mặt sau)

    cho phép bạn cắt đối tượng từ bên dưới / bên trên. Tùy chọn này được sử dụng để cắt các khu vực của vật thể bằng cách thực hiện các điều chỉnh đối tượng theo thứ tự xếp chồng.

  • OCR tự động

    Tự động xác định và nhập văn bản từ ảnh hoặc tài liệu kỹ thuật số để thực hiện việc phân loại hình ảnh