Metadata-Version: 2.1
Name: vietocr
Version: 0.1.1
Summary: Transformer base text detection
Home-page: https://github.com/pbcquoc/vietocr
Author: pbcquoc
Author-email: pbcquoc@gmail.com
License: UNKNOWN
Description: # VietOCR
        Trong project này, mình cài đặt mô hình Transformer OCR nhận dạng chữ viết tay, chữ đánh máy cho Tiếng Việt. Kiến trúc mô hình là sự kết hợp tuyệt vời giữ mô hình CNN và Transformer (là mô hình nền tảng của BERT khá nổi tiếng). Mô hình TransformerOCR có rất nhiều ưu điểm so với kiến trúc của mô hình CRNN đã được mình cài đặt. 
        
        # Cài đặt
        ```
        pip install transformerocr
        ```
        # Quick Start
        Các bạn tham khảo notebook [này]() để biết cách sử dụng nhé. 
        
        # Model zoo 
        Mô hình này được huấn luyện trên tập dữ liệu gồm 10m ảnh, bao gồm nhiều loại ảnh khác nhau như ảnh tự phát sinh, chữ viết tay, các văn bản scan thực tế. 
        
        Đồng thời mình cũng thử nghiệm kết quả của mô hình trên tập dữ liệu [synth 90k](https://www.robots.ox.ac.uk/~vgg/data/text/) mô hình transformerocr cho có độ chính xác full_sequence là 96% trong khi đó một cài đặt khá phổ biến khác dữ trên cơ chế attention cho kết quả là 93%.
        
        # License
        Mình phát hành thư viện này dưới các điều khoản của [Apache 2.0 license]().
        
        # Liên hệ
        Nếu bạn có bất kì vấn đề gì, vui lòng tạo issue hoặc liên hệ mình tại pbcquoc@gmail.com 
        
        (to be continued)
        
Platform: UNKNOWN
Classifier: Programming Language :: Python :: 3
Classifier: License :: OSI Approved :: MIT License
Classifier: Operating System :: OS Independent
Requires-Python: >=3.6
Description-Content-Type: text/markdown
