在商业调查、市场分析或合规风控场景中,批量获取企业基础信息是提升效率的关键。天眼查作为国内主流的商业信息查询平台,提供了批量查询与导出功能,用户可通过网页端或API接口实现高效数据获取。以下从操作流程、技术实现、注意事项三个维度展开说明。 一、网页端批量导出操作 1. 基础批量查询与导出 打开天眼查网页版,首页导航栏点击“批量查询”入口。在输入框中粘贴企业名称列表,需注意: - 名称需逐行排列,避免空格或特殊符号; - 每次最多支持200家企业同时查询; - 匹配结果可能存在误差,需人工核对名称一致性。 完成匹配后,点击“批量查询”获取结果。VIP用户可直接使用“基础工商信息导出”功能,导出字段包括统一社会信用代码、法定代表人、注册资本、成立日期、经营范围等12项核心信息。非VIP用户可手动复制结果至Excel,但需注意格式调整。 2. 高级筛选导出 通过“高级搜索”功能,用户可结合区域、行业、注册资本等条件缩小查询范围。例如筛选“北京市朝阳区+科技推广和应用服务业+注册资本1000万以上”的企业,导出结果更精准。此功能需VIP权限,但可通过7天试用(约2元)临时获取。 二、API接口批量调用 对于需要高频次、大规模数据获取的场景,天眼查开放平台提供企业信息查询API。以“经营异常”接口为例,开发者可通过以下步骤实现批量调用: 1. 获取Token:在开放平台数据中心申请接口权限,获取授权Token; 2. 构造请求:循环读取企业名称列表,拼接URL参数(如`pageSize=20&keyword=企业名称&pageNum=1`); 3. 处理响应:解析JSON格式返回数据,提取所需字段; 4. 错误处理:设置重试机制,应对接口限流或网络波动。 示例代码片段: ```python import requests def query_abnormal(company_name): url = f"http://open.api.tianyancha.com/services/open/mr/abnormal/2.0?pageSize=20&keyword={company_name}&pageNum=1" headers = {'Authorization': 'YOUR_TOKEN'} response = requests.get(url, headers=headers) return response.json() ``` 三、技术实现与反爬策略 1. 网页端反爬应对 天眼查通过动态Cookie、参数加密(如xyz字段)、IP限流等机制防范爬虫。实际测试中,采用以下方案可提升稳定性: - Selenium自动化:模拟浏览器操作,每10分钟刷新页面更新Cookie; - 并发控制:20并发请求时错误率较低,30并发易触发限流; - 断点续传:使用Redis记录查询进度,中断后从断点恢复。 2. 数据解析优化 企业信息页面结构复杂,需精准定位DOM节点。例如解析企业地址时,需通过XPath定位`div.contact.row`下的第二个有效节点,避免因空值导致顺序错乱。 四、注意事项 1. 权限限制:非VIP用户单次导出不超过200条,VIP用户每日导出上限为5000条; 2. 数据准确性:名称匹配错误率约3%-5%,需人工核对“曾用名”“英文名”等字段; 3. 合规使用:批量获取数据仅限内部分析,不得用于商业销售或非法用途; 4. 性能优化:大规模导出时建议分批次操作,避免服务器响应超时。 通过上述方法,用户可高效完成天眼查企业资料的批量导出,为商业决策提供数据支撑。 |