Metadata-Version: 2.1
Name: pyawabi
Version: 0.2.5
Summary: A morphological analyzer using mecab dictionary.
Home-page: http://github.com/nakagami/pyawabi/
Author: Hajime Nakagami
Author-email: nakagami@gmail.com
License: MIT
Description: # pyawabi
        
        `pyawabi` is a python warapper for awabi(https://github.com/nakagami/awabi).
        
        ## Requirements
        
        - python3.6+
        - Rust https://www.rust-lang.org/learn/get-started
        - python3-dev packages https://github.com/PyO3/pyo3#usage
        - MeCab dictionary https://github.com/nakagami/awabi#requirements-and-how-to-install
        
        ## Install
        
        ```
        $ pip install pyawabi
        ```
        
        ## How to use
        
        ### pyawabi command
        
        ```
        $ echo 'すもももももももものうち'  | pyawabi
        すもも  名詞,一般,*,*,*,*,すもも,スモモ,スモモ
        も      助詞,係助詞,*,*,*,*,も,モ,モ
        もも    名詞,一般,*,*,*,*,もも,モモ,モモ
        も      助詞,係助詞,*,*,*,*,も,モ,モ
        もも    名詞,一般,*,*,*,*,もも,モモ,モモ
        の      助詞,連体化,*,*,*,*,の,ノ,ノ
        うち    名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
        EOS
        ```
        ```
        $ echo 'すもももももももものうち'  | pyawabi -N 2
        すもも  名詞,一般,*,*,*,*,すもも,スモモ,スモモ
        も      助詞,係助詞,*,*,*,*,も,モ,モ
        もも    名詞,一般,*,*,*,*,もも,モモ,モモ
        も      助詞,係助詞,*,*,*,*,も,モ,モ
        もも    名詞,一般,*,*,*,*,もも,モモ,モモ
        の      助詞,連体化,*,*,*,*,の,ノ,ノ
        うち    名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
        EOS
        すもも  名詞,一般,*,*,*,*,すもも,スモモ,スモモ
        も      助詞,係助詞,*,*,*,*,も,モ,モ
        もも    名詞,一般,*,*,*,*,もも,モモ,モモ
        もも    名詞,一般,*,*,*,*,もも,モモ,モモ
        も      助詞,係助詞,*,*,*,*,も,モ,モ
        の      助詞,連体化,*,*,*,*,の,ノ,ノ
        うち    名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
        EOS
        ```
        
        ### use as package
        
        use function
        ```
        >>> import pyawabi
        >>> import pprint
        >>> pp = pprint.PrettyPrinter()
        >>> pp.pprint(pyawabi.tokenize("すもももももももものうち"))
        [('すもも', '名詞,一般,*,*,*,*,すもも,スモモ,スモモ'),
         ('も', '助詞,係助詞,*,*,*,*,も,モ,モ'),
         ('もも', '名詞,一般,*,*,*,*,もも,モモ,モモ'),
         ('も', '助詞,係助詞,*,*,*,*,も,モ,モ'),
         ('もも', '名詞,一般,*,*,*,*,もも,モモ,モモ'),
         ('の', '助詞,連体化,*,*,*,*,の,ノ,ノ'),
         ('うち', '名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ')]
        >>> pp.pprint(pyawabi.tokenize_n_best("すもももももももものうち", 2))
        [[('すもも', '名詞,一般,*,*,*,*,すもも,スモモ,スモモ'),
          ('も', '助詞,係助詞,*,*,*,*,も,モ,モ'),
          ('もも', '名詞,一般,*,*,*,*,もも,モモ,モモ'),
          ('も', '助詞,係助詞,*,*,*,*,も,モ,モ'),
          ('もも', '名詞,一般,*,*,*,*,もも,モモ,モモ'),
          ('の', '助詞,連体化,*,*,*,*,の,ノ,ノ'),
          ('うち', '名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ')],
         [('すもも', '名詞,一般,*,*,*,*,すもも,スモモ,スモモ'),
          ('も', '助詞,係助詞,*,*,*,*,も,モ,モ'),
          ('もも', '名詞,一般,*,*,*,*,もも,モモ,モモ'),
          ('もも', '名詞,一般,*,*,*,*,もも,モモ,モモ'),
          ('も', '助詞,係助詞,*,*,*,*,も,モ,モ'),
          ('の', '助詞,連体化,*,*,*,*,の,ノ,ノ'),
          ('うち', '名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ')]]
        >>>
        ```
        
        use tokenizer object
        
        ```
        >>> tok = pyawabi.Tokenizer()
        >>> pp.pprint(tok.tokenize("すもももももももものうち"))
        [('すもも', '名詞,一般,*,*,*,*,すもも,スモモ,スモモ'),
         ('も', '助詞,係助詞,*,*,*,*,も,モ,モ'),
         ('もも', '名詞,一般,*,*,*,*,もも,モモ,モモ'),
         ('も', '助詞,係助詞,*,*,*,*,も,モ,モ'),
         ('もも', '名詞,一般,*,*,*,*,もも,モモ,モモ'),
         ('の', '助詞,連体化,*,*,*,*,の,ノ,ノ'),
         ('うち', '名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ')]
        >>>
        ```
        
Keywords: MeCab
Platform: UNKNOWN
Classifier: License :: OSI Approved :: MIT License
Classifier: Development Status :: 4 - Beta
Classifier: Intended Audience :: Developers
Classifier: Programming Language :: Python
Classifier: Programming Language :: Python :: 3.6
Classifier: Programming Language :: Python :: 3.7
Classifier: Programming Language :: Python :: 3.8
Classifier: Programming Language :: Python :: 3.9
Classifier: Programming Language :: Rust
Classifier: Operating System :: POSIX
Description-Content-Type: text/markdown
