将地址按照基础地物进行分类聚合,结合百度地图领先的地图地理信息解析能力以及百度NLP自然语言能力,对地址信息进行结构化理解,并结合基础地图单位进行位置聚合。
目前可聚合的单位为:省、市、区县、乡镇街道、道路、路段、末端地点(POI或AOI)
结构化解析并提取复杂地址中的核心内容,包含人名、联系方式、行政区划结构(省、市、区县、乡镇街道)、POI信息。
针对系统传入地址进行判断是否存在不合规的情况,通过找到不合规的case问题,系统给用户提示问题的原因,来协助降低地址输入时的错误率。
注意:该功能为高级付费服务,用户不能直接在官网付费入口中直接购买,如有采买需求,请提交工单联系我们,将有商务与您取得联系。
异常地址识别功能识别范围及对应提示内容如下:
提示不合规问题 | 识别范围 | 提示内容 | 举例 | ||
---|---|---|---|---|---|
行政区划冲突 | 前四级行政区划 | 行政区划冲突 |
地址:北京市上海市海淀区上地十街百度大厦 “上海市”与“北京市”冲突 | ||
行政区划冗余 | 前四级行政区划 | 行政区划冗余 |
地址:北京市北京市海淀区海淀区上地十街百度大厦 “海淀区”与“海淀区”冗余 | ||
行政区划错误 | 前三级行政区划 | 省级行政 区划错误 |
地址:山东省阳泉市盂县秀水镇学府苑 “阳泉市”为“山西省”非“山东省”省级行政区划错误 | ||
城市级行政 区划错误 |
地址:山西省太原市盂县秀水镇学府苑 “学府苑“为“阳泉市”非“太原市”城市级行政区划错误 | ||||
区县级行政 区划错误 |
地址:山西省阳泉市平定县秀水镇学府苑 匹配后发现“秀水镇”非“平定县”区县级行政区划错误 | ||||
地址结构缺失 |
前四级行政区划 | 省级地址结构 缺失 |
地址:青岛市李沧区沧口街道牛毛山公园 缺少“山东省“省级地址结构 | ||
城市级地址 结构缺失 |
地址:山东省李沧区沧口街道牛毛山公园 | ||||
区县级地址 结构缺失 |
地址:山东省青岛市沧口街道牛毛山公园 缺少“李沧区“区县级地址结构 | ||||
乡镇级 地址结构缺失 |
地址:山东省青岛市李沧区牛毛山公园 缺少“沧口街道”乡镇级地址结构 |
https://api.map.baidu.com/address_analyzer/v1? //GET请求
https://api.map.baidu.com/address_analyzer/v1?address=北京市海淀区信息路甲九号&ak=你的ak
参数名称 | 参数含义 | 示例 | 字段类型 | 默认值 | 是否必须 | 备注 |
---|---|---|---|---|---|---|
address | 需要解析的地址文本 | 北京市海淀区信息路甲九号 | string | 无 | 是 | |
output_tag | 需聚合的POI分类 | 小区、写字楼、all | string | 住宅区|园区|政府机构|高等院校|购物中心等大型聚居区 | 否 | 仅针对POI,"|"分隔。当设置为"all"时,聚合目标为全量 poi |
aoi_radius | 聚合AOI单位外扩范围 (0-1000m) | 100 | int | 0 | 否 | 若地址在AOI外扩范围内,同样会聚合到该AOI对应的POI上 |
poi_score | POI聚合精度,取值范围“0-100”,数值越大,精度越高(但召回会降低) | 75(默认值)、100、90 | int | 75 | 否 | 该字段取值较高时,仅在服务认为聚合精度较高的前提下,才会召回POI字段数据 |
confidence | 对应召回字段中的confidence,取值100-0。该字段用于触发补充解析策略,对置信度在配置值以下的结果,进行补充解析,以提高结果精度 |
50 | int | 无 | 否 | 该字段配置会增加服务耗时。经评测,在保证准确率提升效果的前提下,取值=50,服务平响增长相对较小。也可根据业务数据评测,决定取值。 |
model | 是否使用标准化模式 | 1、0 | string | 0 | 否 | 1(使用) |
ret_coordtype | 召回坐标的类型bd09ll(百度经纬度坐标系); bd09mc(百度墨卡托米制坐标); | bd09ll | string | bd09mc | 否 | |
addr_verify | 是否触发异常地址识别功能 | 1、0 | int | 0 | 否 | 1(调用)返回problem
其他值:返回problem |
ak | 用户服务访问密钥。 | cO3seSdqC*********ObPGvXNcwcW04 | string | 无 | 否 |
参数名 | 含义 | 备注 | 示例 | ||
---|---|---|---|---|---|
status | 状态码 | 0 | |||
address | 请求中的address信息 | 北京市海淀区信息路甲九号 | |||
result | |||||
name | 地址文本中提取出的主体信息 | model=1时召回 | 王先生 | ||
tel | 地址文本中提取出的联系方式 | model=1时召回 | 18180000001 | ||
province | 省 | 北京市 | |||
province_code | 省编码 | 110000 | |||
city | 市 | 北京市 | |||
city_code | 市编码 | 110000 | |||
county | 区县 | 海淀区 | |||
county_code | 区县编码 | 110108 | |||
town | 乡镇 | 上地街道 | |||
town_code | 乡镇编码 | 110108022 | |||
road | 道路 | 开拓路 | |||
road_code | 道路编码 | 1505378891 | |||
section | 路段 | 一条道路包含多个路段。括号内为该路段的语义化描述。 | 开拓路(未知路) | ||
section_code | 路段编码 | 1520321854_1520321885 | |||
poi | 聚合后的兴趣点名称 | 奎科科技大厦 | |||
poi_code | 聚合后的兴趣点编码 | 1a30c5f8cbb55eff71210b02 | |||
problem | 输入地址不合规提示 |
"|行政区划冲突" |
行政区划冲突 注意:该功能为高级付费服务,用户不能直接在官网付费入口中直接购买,如有采买需求,请提交工单联系我们,将有商务与您取得联系。 | ||
detail | |||||
poi_xy | 聚合后兴趣点坐标 | 只有解析到兴趣点数据时(即poi字段不为空),才会召回该字段 | |||
poi_tag | 聚合后兴趣点类别 | 只有解析到兴趣点数据时(即poi字段不为空),才会召回该字段 | |||
address_poi | 地址中原始兴趣点名称 | 注意和poi字段区分 | 奎科科技大厦 | ||
address_xy | 地址坐标 | 只有解析到地址准确位置时,才会召回该字段 | |||
address_precise | 是否精确解析地址 | 1为精确查找,即准确打点;0 为不精确,即模糊打点。 | |||
address_ confidence | 描述地址解析打点绝对精度(即 address_xy 坐标点的误差范围)。 | confidence=100, 解析误差绝对精度小于20m; confidence≥90,解析误差绝对精度小于50m; confidence≥80,解析误差绝对精度小于100m; confidence≥75,解析误差绝对精度小于200m; confidence≥70,解析误差绝对精度小于300m; confidence≥60,解析误差绝对精度小于500m; confidence≥50,解析误差绝对精度小于1000m; confidence≥40,解析误差绝对精度小于2000m; confidence≥30,解析误差绝对精度小于5000m; confidence≥25,解析误差绝对精度小于8000m; confidence≥20,解析误差绝对精度小于10000m; | |||
address_ comprehension | 描述地址理解程度。分值范围0-100,分值越大,服务对地址理解程度越高 | ||||
address_level | 能精确理解的地址类型 | 包含: UNKNOWN、国家、省、城市、区县、乡镇、村庄、道路、地产小区、商务大厦、政府机构、交叉路口、商圈、生活服务、休闲娱乐、餐饮、宾馆、购物、金融、教育、医疗、工业园区 、旅游景
点、汽车服务、火车站、长途汽车站、 桥、停车场/停车 区、港口/码头、收费 区/收费站、飞机 场、机场 、收费处/ 收费站、加油站、绿地、门址 |
|||
address_detail | 地址文本提取主体、联系方式、行政区划后剩余的详情信息 | model=1时召回 |
GCJ02:是由中国国家测绘局制订的地理信息系统的坐标系统。由WGS84坐标系经加密后的坐标系。
BD09:为百度坐标系,在GCJ02坐标系基础上再次加密。其中bd09ll表示百度经纬度坐标,bd09mc表示百度墨卡托米制坐标。
字符集合 | 字符 |
URL非保留字 |
a b c d e f g h i j k l m n o p q r s t u v w x y z A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 0 1 2 3 4 5 6 7 8 9 - _ . ~ |
URL保留字 |
! * ' ( ) ; : @ & = + $ , / ? % # [ ] |
附注:
Javascript中一般采用EncodeURIComponent函数对特殊字符进行编码。
Java中可以使用函数URLEncoder.encode对特殊字符进行编码。
C#中可以使用函数HttpUtility.UrlEncode对特殊字符进行编码。
Php中可以使用函数Urlencode对特殊字符进行编码。
地址解析聚合及异常地址识别服务与其他API服务一样,具有每天使用配额和并发次数的限制。使用前,您需要提交工单申请对应服务权限,权限开通后您将获取每天100次免费请求次数。如果您需要对服务进行大量测试,当前配额或并发不能满足业务使用需求,需联系我们申请做进一步提升,请详细填写日配额和并发预估计算方法,以便评估。 注意:地址解析聚合与异常地址识别服务共用每天100次免费请求次数
地址解析聚合及异常地址识别服务为高级服务,用户不能直接在官网付费入口中直接购买。如有采买需求,请提交工单联系我们,将有商务与您取得联系。
2019年4月30日
V1.0
2019年10月12日
V2.0
2020年12月24日
V3.0
产品上线。
可对地址中联系人、联系方式以及地址核心行政区划结构进行提取。