当前位置: 首页 > news >正文

NLP技术在营业选址中的实践与探索

传统营业选址面临的问题

在电信业务的服务流程中,用户装机地址的准确性和清晰度对于整个服务体验和运营效率起着至关重要的作用。然而,在实际操作中,装机地址的确定往往面临诸多挑战,这些问题不仅影响用户的服务体验,也对电信运营商的资源配置和服务质量提出了考验。以下是在电信业务中,装机地址选址过程中所面临的一些主要问题:

01 客户描述地址找不到

客户描述的装机地址搜索不到,或者客户描述不清详细的地址,缺乏GIS地图等辅助手段,导致无法直接受理,耗费较多装维人员地址核查工作量。

02 语义理解能力不足

完全基于文本匹配算法进行搜索,缺乏对相同语义的近似地址的理解能力譬如4-1-902与4栋1单元902室、威尼斯水城与北外滩水城等。

03 输入容错能力不足

标准地址维护及搜索输入过程中对于同音字、近音字的容错能力不足,地址录入或搜索输入错误导致搜索不出来。

04 多渠道支撑能力不足

针对前台营业、电商渠道、公众号、小程序等多种不同的业务办理渠道对地图选址服务的诉求不一致,缺乏面向不同用户的高效个性化选址服务。

智能化的转型,创新的智能选址理念

大模型等技术趋势正在深刻改变我们的工作与生活,带来多方面的变革与优势。利用深度学习技术,大模型能更好地理解用户需求和偏好,提供个性化的服务和体验,比如定制化推荐、智能客服对话等,促进了不同行业和技术领域的交叉融合,为解决综合性问题提供了新途径。

结合传统营业选址所面临的问题,通过大模型或者小模型等技术,为选址提供了创新思路,催生出来智能化选址的整体解决方案。

图片

                                                

数据层:对地址及其关联数据进行管理,包括原生的标准地址数据、图商提供的POI\AOI数据、位置坐标数据、地址和资源覆盖数据等。这些数据一方面为训练模型提供输入;另外一方面又是上层应用的使用数据集。

服务层:构建地址大模型或者地址小模型的服务,结合搜索引擎服务,为上层应用提供服务能力支撑,包括文本选址能力、GIS选址能力。

应用层:根据业务场景,分别提供营业厅选址、电商渠道选址、微信小程序选址、客户自助选址等应用。

智能选址的关键举措

01 提升地址准确性,构建相似关系

标准地址是客户接入网络的关键衔接点;是业务受理的第一入口,关系着业务是否能正常受理;是维系客户的关键点,关系着是否可以及时上门安装和修障;是网络能力对外开放的风向标,关系着网络覆盖范围;是保障网络质量的枢纽站,关系着重点区域、重点客户的服务质量。

引入图数据库构建地址知识图谱,用于分析标准地址的规范性、完整性;引入地址相似度算法,构建相似度分析模型,用于分析标准地址的一致性和重复性。

通过使用图数据库技术,将千万级的标准地址按照点-线的结构进行存储,构建出如下的地址图谱,基于此图谱上进行标准地址级别规范性、完整性的诊断和稽核。

图片

在图谱中除了展示上下级之间的地址关系外,同时还记录文字相似的地址关系、位置相近的地址关系,从而可以直接在图谱中查找。

地址相似度计算方法有如下两种:

文本相似度:

在传统通过词频进行分析的基础上,扩展增加NLP技术叠加语义的理解,实现更精准的文本相似分析。

位置相似度:

将标准地址转换到地图上的经纬度坐标点,通过对坐标点之间进行距离计算,从而实现位置相似度分析。

  • 二维地图上计算两点之间的距离,最常用的就是欧几里德公式:

图片

  • 当两点之间的距离很近(如<10米)时,或者等于0时,可以判断为这2个地址相似/相同。

图片

02 基于NLP通用模型的智能选址服务

针对微信小程序、电渠等多样化的渠道选址特点,用户描述的装机地址与标准地址存在较大差异,对地址一次匹配成功率要求高,借助NLP通用模型的语义理解和智能分词能力,有效提升用户地址与标准地址匹配准确性。整体解决思路如下所示:

图片

根据已有地址数据进行训练,地址语义模型训练相关主要语料如下:

  • 地名(全国地名)

  • 机构(全国机构)

  • 数词(阿拉伯、中文)

  • 量词(地址相关)

  • 简称(地址相关)

  • 方位词(如东南、西北等)

  • 名词(建筑物、交通设施、商业名称、历史地点等等)

  • 描述词(如旧、新、内、外、上、下、中等)

选址过程NLP切入应用:

图片

  • 用户输入生活地址或描述地址,输入过程中地址自动补全

  • 基于NLP通用模型的语义理解,实现精准地址分词

  • 根据同义词库、忽略词库、错别词库智能化完成语义转换和标准化,补齐缺失地址级别

  • 基于不同的选址场景,对敏感地址进行过滤和脱敏,根据地址覆盖类型缩小选址范围

  • 通过搜索引擎的搜索能力,对多源地址数据进行综合搜索

  • 根据匹配到的标准地址,结合覆盖场景及分级匹配权重,对不同地址的匹配进行综合评分

  • 基于评分及搜索配置进行智能化的搜索排序

03 基于地址领域模型的智能选址服务

基于结合省内地址库数据和地图POI数据进行预训练的定制化地址领域模型,实现地址基于文本的模糊检索,并支持基于POI的地址近似度排序,有效解决传统选址基于固定规则不支持语义和位置理解的问题,提升用户一次选址成功率。

地址领域模型的训练:

图片

  • 基于省内地址库地址数据的模型定制化训练

  • 基于异常匹配反馈的微调调优

  • 搜索结果基于POI近似度算法排序

地址领域模型的选址应用:

图片

  • 场景1:用户输入“威尼斯水城12街区4-102”,准确匹配标准地址“**省**市**区**路**号北外滩水城十二街区4栋102室” 

  • 场景2:用户输入“**商场旁边的花圆小区”,准确匹配标准地址“**省**市**区**街道123号花园小区”

  • 场景3:用户输入“花园小区1-3-201”,该地址实际不存在,自动匹配到多个附近的近似地址给用户,“**省**市**区花园小区1号楼”等

带来的成效

极致用户搜索体验:通过用户输入地址的输入纠错、智能化分词,并应用大模型的能力,实现高度容错的智能化搜索体验。

一次选址成功率大于95%:应用大模型技术,对传统选址能力进行有效补充,并通过自学习能力,有效提升一次选址成功率。

降低地址运维工作量:通过地址别名挖掘、地址补全、地址自学习覆盖等智能化的能力,有效降低地址及覆盖数据维护工作量。

图片

某智能选址项目中通过引入NLP智能选址能力,同时实现了PC端和微信小程序的高效选址和资源能力预判,用户在输入地址信息时更加的简便,无需人为进行空格分割短语,地址搜索更加精准。


http://www.mrgr.cn/news/35763.html

相关文章:

  • java:继承题练习
  • 大数据新视界 -- 大数据大厂之 Impala 性能飞跃:动态分区调整的策略与方法(上)(21 / 30)
  • Vue3 -- 环境变量的配置【项目集成3】
  • 万字长文解读深度学习——Transformer
  • 刷算法题(C++)
  • 细说STM32单片机USART中断收发RTC实时时间并改善其鲁棒性的另一种方法
  • SelMatch:最新数据集蒸馏,仅用5%训练数据也是可以的 | ICML‘24
  • Linux基本指令(2)
  • 【GIS】GeoPandas:Python矢量数据处理
  • Java项目: 基于SpringBoot+mybatis+maven实现的智能推荐卫生健康系统分前后台(含源码+数据库+开题报告+任务书+毕业论文)
  • Mybatis Mapper 代理开发
  • 测试面试题:测试计划方案应该包含哪些内容?
  • connect timed out 详解及排查
  • Codeforces Beta Round 4 (Div. 2 Only) 4D. Mysterious Present (最长上升子序列变形)
  • Ubuntu环境切换到服务器某个用户后source等命令和Tab快捷补全都用不了了,提示没找到,但root用户可以
  • PCDN技术如何适应不同用户的需求和网络环境的变化?(贰)
  • OpenAI发布多语言MMMLU数据集;火山引擎发布AI视频生成大模型豆包
  • 大量数据分批次处理+concurrent.futures.ThreadPoolExecutor多线程处理文件
  • 【LeetCode每日一题】——LCP 51.烹饪料理
  • 扫雷老年版2.0无猜模式
  • postman下载安装和导入导出脚本一键执行
  • 代码随想录算法训练营第29天|134. 加油站、135. 分发糖果、860.柠檬水找零、406.根据身高重建队列
  • 【机器学习】过拟合与欠拟合——如何优化模型性能
  • 【活动】人工智能时代,程序员如何保持核心竞争力?需要掌握哪些技能?
  • 在多态的方法调用中为什么会出现“左边编译左边运行”的现象?多态创建的对象到底是谁属于父类还是子类?通过深扒集合remove方法调用理解其原理
  • CAPL—on signal到底该怎么玩?