Metadata-Version: 2.1
Name: qdata
Version: 0.2.2
Summary: Python SDK for getting data quickly
Home-page: https://github.com/longxiaofei/spider-BaiduIndex
Author: longxiaofei
Author-email: libra.19951002@gmail.com
License: UNKNOWN
Description: # Qdata - Python SDK for index and search
        
        ### 为什么给项目改了名
        
        * 想做一个提供更多数据的SDK包,但不一定有时间。。。
        * 老的代码包可以在<a href="https://github.com/longxiaofei/spider-BaiduIndex/tree/old_baiduindex">old_baiduindex</a>里找到
        * 会根据我自己个人的数据需求，往里面添加不同的数据源，如果恰好帮助到你，很开心
        * 老的数据源会尽力维护
        
        ### Data Source
        
        * http://index.baidu.com/
        * http://www.baidu.com/
        * https://www.tianyancha.com/advance/search
        
        ### Install
        
        ```shell script
        pip uninstall pycrypto  # 避免与pycryptodome冲突
        pip install --upgrade qdata
        ```
        
        ### Examples
        
        #### 百度指数
        `./examples/test_baidu_index.py`
        
        获取百度指数时不要太暴力，可以参考以下代码，进行百度指数数据的获取
        
        ```python
        import time
        
        from qdata.baidu_index import get_search_index
        from qdata.baidu_index.common import split_keywords
        
        
        keywords_list = [['张艺兴', '汪峰'], ['百度'], ['疫情', '杭州'], ['北京', '疫情'], ['猫粮'], ['流浪猫']]
        cookies = """xxx"""
        
        for keywords in split_keywords(keywords_list):
            for index in get_search_index(
                keywords_list=keywords,
                start_date='2018-01-01',
                end_date='2019-05-01',
                cookies=cookies
            ):
                print(index)
            time.sleep(15)
        
        ```
        
        #### 百度搜索
        `./examples/test_baidu_search.py`
        
        #### 百度登录(获取百度Cookie)
        `./examples/test_baidu_login.py`
        
        * 目前只提供二维码登录，密码账号登录也可以做，但不做，因为没必要。
        * 幸好工作不做爬虫，心太累了。
        
        #### 天眼查
        `./examples/test_tianyancha.py`
        
        * 老婆做汇报着急用
        
        ### Changelog
        
        * 2021/03/25 上线
        * 2021/03/26 更新百度登录功能
        * 2021/04/07 百度指数新增:实时百度指数
        * 2021/04/13 添加天眼查高级搜索公司数数据
        * 2021/05/18 修正打包问题
        * 2022/05/12 百度指数添加Cipher-Text(不确定部分逻辑)
        * 2022/05/16 一些小的改动
        * 2022/05/30 修正百度指数加密逻辑
        
Keywords: data sdk
Platform: UNKNOWN
Classifier: License :: OSI Approved :: MIT License
Classifier: Programming Language :: Python :: 3
Classifier: Programming Language :: Python :: 3.6
Classifier: Programming Language :: Python :: 3.7
Classifier: Programming Language :: Python :: 3.8
Classifier: Programming Language :: Python
Description-Content-Type: text/markdown
