当前位置: 首页 > news >正文

对商品分类系统的若干问题的思考

   科学研究的目的就是研究事物的特征,并根据共同的特征加以分类

        商品分类是商业,制造业中最普遍的活动,几乎所有的企业,电商平台都要对销售的商品,使用的原材料(BOM)进行分类和编号。

       商品分类貌似没有多少技术含量,它是数字化转型的重要基石。一个不合理的分类方法会导致混乱和难以使用。

现有商品分类系统遇到的问题

各种标准化组织和机构提出了分类系统,它们包括:

  •  UNSPSC
  •   GS1
  • ETIM
  • ECL@SS
  • IEC 61360

      它们有的是公开免费的,有的是收费服务的。分类方式也各不相同。使用这些分类标准面临各种挑战。

      我们以gs1为例,讨论现有商品分类中遇到的问题。

       GS1全球商品分类标准(Global Product Classification, GPC)不断扩展更新,每年发布两个新版本。GPC分类代码按照大类(Segment)、中类(Family)、小类(Class)、细类(Brick)来划分,并细分为具体的商品核心属性类型和属性值。商品数据交换中,通常采用第4级代码,即细类代码。

    但是这种4级分类仍然不够细。进一步细分只能依靠属性(attributes)来分类了。例如服装的分类如下

Segment 67000000服装

Segment67000000 服装Family67040000内衣Family67010000服装Class67010800上半身服装或上衣Brick10001361上半身服装、上衣组合装Brick10001350夹克、外套、羊毛衫、马甲Brick10001351毛衣、套头毛衣Brick10001352长袖衬衫、女式衬衫、马球衫、T恤

显然这样的分类不够的,需要进一步细分 ,比如男女,风格,材料等。

属性,特征和特性区别

      在讨论信息模型时,经常提到属性(attribute),特征(Property)和特性(Feature),有的地方使用attribute ,有的地方使用特征(Property)或者特性(Feature) ,那么它们到底有什么区别呢?

      我们知道,模型是事物的简单描述。模型描述了事物的特征(Property)以及与其它事物的关系(Relationship)。

        从分类的视角看,事物是通过某些主要特征来分类的,主要特征相同的商品被分为一类。这主要特征称为属性(attribute),我们能够体会属性与特征的不同,用于分类的特征是属性。

       在某些分类系统中,属性是类别中默认的。而商品的描述中包含了某些特征(Property),而在一些分类系统中不仅规定了类别,又定义了属性

     例如服装的性别,gs1 提供了属性和属性值

        而Feature (特性)是增加功能或吸引力的独特方面或品质。这些方面通常作为卖点进行推广或突出显示。它们是旨在带来特定优势或功能的元素,使产品从竞争对手中脱颖而出。特性可以理解为独特的特征。

     例如:毛衣的属性及性别的属性值

Brick10001351毛衣、套头毛衣Attribute20000045消费者年龄段Attribute20001131性别Attribute Value30004039男性(雄性)Attribute Value30003891女性(雌性)Attribute Value30002518尚未确定的Attribute Value30002515未分类的Attribute Value30004340中性的Attribute20003164是否带帽Attribute20001141是否保暖Attribute20001941服装袖长Attribute20000794材料类型Attribute20001942毛衣、套头毛衣类型

     笔者主张在产品分类系统中只有类别,不包含属性。而在商品描述中包含特征(Property)。这样更加清晰一点。而Feature 更多地包含的宣传文档中。

 分类系统的挑战

常见的分类系统有下列几种:

GS1ETIMECL@SSUNSPSC
SEGMENTGroupSegmentsSegment
FAMILYClassMain GroupsFamily
CLASSGroupsClass
BRICKCommodity classesCommodity
Business Function

     但是它们之间的分类方式是不同的。

        比如:医疗设备。 在GS1 中是一个Brick,而在ECL@SS 中是一个Segment,这就意味着在ECL@ 中,医疗设备分的更细 。

 相比ECL@SS 而言,gs1 的分类过于宽泛。

分类系统的颗粒度

        到底分类到多细才合适呢?这也许没有明确的答案,侧重点不同,分类的颗粒度也不同,在笔者看来,分类系统的颗粒度与产品属性的颗粒度有关。最底层的项目,应该具有相同的属性。

        某种意义上讲,属性也是一种分类。可以将分类变成属性例如:性别。你可以将服装分类为男性服装,女性服装,儿童服装,成人服装和老年服装。当然你也可以在服装中,定义:适应性别,适应年龄段属性。

我们的研究更倾向在gs1 的基础上进一步细分,将gs1与ecl@ss 结合起来。构建6 级分类系统

  • Segnment
  • Family
  • Brick
  • Main Group
  • Group
  • Commodity

这样的安排的好处

  •   商品分类的颗粒度更细,符合商业分类的习惯
  •   有利于引用ECL@SS 的属性
  •   有利于gs1和ECL@SS 的映射和转换
  •   采用12位分类编码,能够细分更多的商品,前三层对应gs1编码,后三层对应ECL@SS 的MainGroup,Group和Commodity

  

商品的特征

商品的模型是由商品的特征(Property)组成的。分类系统与商品特征结合在一起,形成了如下分层结构。

  • Segnment
  • Family
  • Brick
  • Main Group
  • Group
  • Commodity
    • Property
      • Property
        • Property

     这种方式在gs1 的BRICK 基础上进一步细分,商品特征描述提供了商品信息模型。

分类系统与产品信息管理系统的关系

       分类系统的主要用途是商品的信息管理(PIM),确切地讲,分类系统是产品的模型,而商品是产品模型的实例及其组合。需要将分类系统和PIM 系统区分开来,分类数据库中每一项对应一个商品类型,而产品数据库中的每一项是一个产品的SKU(库存量单位)。SKU 包含了无包装单元,单品,包装和托盘。无包装单元对应GS1 中的一个类。而单品,包装箱和托盘包含了SKU 的其它一些信息。比如SKU 的名称,图片,重量,价格等等。

        商品的基本属性与SKU 的属性是不同的,如果将所有的SKU 信息包含到分类系统中,会引起混乱。将它们分开视乎更合理。

   分类系统的项目是无包装单元的属性

BMEcat

  BMEcat 是一个目录交换标准,创建于 1999 年,由德国 BME - Bundesverband Materialwirtschaft, Einkauf und Logistik e. V.. 协会开发。该标准基于 XML,完全开放且不收取任何费用,其最新版本是 BMEcat 2005。 

        供应链中的所有合作伙伴(制造商、批发商、供应商)都在交换越来越多的数据,而不同的数据格式使流程复杂化。通过使用 BMEcat 标准化信息系统之间的通信,大大降低了所有参与公司的成本。

PIM的数据模型

  •  产品模型
  • 机构模型
  • 测量单位

产品模型 

{"ID":"产品ID""Name":"商品名称","Type":["无包装单元","单品","包装箱","托盘"],"Items":[{"Code":"单元的编码","Type":"单元类型","Number":1}] "Supply":{"Name":"供应商名称","Id":"供应商ID",}"Brand":"品牌","Measurement":{"Length":"长度","Width”:"宽度","Height":"高度"},"Images":[{}]"Documents":[{}] 
"Price":"价格"}

结论

  分类系统是数字化转型的重要基石。同时它也是十分费时的辛苦工作。也许chatGPT AI 工具能够提升构建分类系统的效率。本文提出了目前几种分类系统存在的问题,并且提出了自己的看法。下一步我们将问题进一步的细化。从中发现更多的问题和解决方法。

   


http://www.mrgr.cn/news/31342.html

相关文章:

  • Go语言基础学习01
  • OpenHarmony(鸿蒙南向开发)——小型系统内核(LiteOS-A)【扩展组件】上
  • C#开发记录如何建立虚拟串口,进行串口通信,以及通信模板
  • DOS(Disk Operating System,磁盘操作系统)常用指令
  • Java知识点小结3:内存回收
  • C++自动寻径算法
  • 网关登录校验(2)----网关如何将用户信息传递给微服务
  • Django+React+Neo4j实现的地质领域知识图谱系统
  • DNS解析流程
  • pandas入门
  • day51
  • df将字典转换为df,如何以key为行而不是列
  • 【刷题日记】15. 三数之和
  • 有关JS下隐藏的敏感信息
  • 算法【Dijkstra算法及分层图最短路】
  • C++——用选择法对10个数值进行排序。
  • [嵌入式] 3588相关
  • 码头童话,“丈量”行业数智化转型
  • .config、Kconfig、***_defconfig之间的关系和工作原理
  • 对于C++继承中子类与父类对象同时定义其析构顺序的探究