Metadata-Version: 2.1
Name: tomba
Version: 0.1.1a1
Summary: Identifique localizações brasileiras em um texto 🏘
License: MIT
Author: Dados Abertos de Feira
Author-email: dadosabertosdefeira+gh@gmail.com
Requires-Python: >=3.8,<4.0
Classifier: License :: OSI Approved :: MIT License
Classifier: Programming Language :: Python :: 3
Classifier: Programming Language :: Python :: 3.8
Classifier: Programming Language :: Python :: 3.9
Requires-Dist: jupyter (>=1.0.0,<2.0.0)
Requires-Dist: pandas (>=1.2.1,<2.0.0)
Requires-Dist: setuptools (>=53.0.0,<54.0.0)
Requires-Dist: spacy (>=3.0.0)
Requires-Dist: wheel (>=0.36.2,<0.37.0)
Description-Content-Type: text/markdown

# tomba

[![Built with spaCy](https://img.shields.io/badge/made%20with%20❤%20and-spaCy-09a3d5.svg)](https://spacy.io) [![CI](https://github.com/DadosAbertosDeFeira/tomba/actions/workflows/ci.yml/badge.svg)](https://github.com/DadosAbertosDeFeira/tomba/actions/workflows/ci.yml)

Identifique endereços, bairros e outras localizações brasileiras em um texto. 🏘

Não sabe o que é o [Tomba](https://pt.wikipedia.org/wiki/Tomba_(Feira_de_Santana))?

---

Essa biblioteca é experimental e está no seu estágio inicial de desenvolvimento.

Objetivo:

```python
import tomba


tomba.get_locations(
    "Contratação de empresa de engenharia para executar obras "
    "de pavimentação localizados no CEP 44100-000, no bairro Tomba."
)
```

Saída:

```
[
    {"type": "zipcode", "start": 92, "end": 123},
    {"type": "neighborhood", "start": 113, "end": 118}
]
```

## Desenvolvimento

Utilizamos o [poetry](https://python-poetry.org/) para empacotamento e gerenciamento das dependências.

Para instalar as dependências, execute `poetry install`.

Para configurar o [spacy](https://spacy.io) em português, execute:

```
poetry run python -m spacy download pt_core_news_sm
```

Para rodar os testes:

```
poetry run pytest
```

Para gerar um novo modelo:

```
poetry run python tomba/models.py
```

