当前位置: 首页 > news >正文

同济子豪兄--传统图机器学习的特征工程-节点【斯坦福CS224W】

引言:机器是看不懂图的节点、连接之类的东西,所以将这些东西以矩阵和向量的形式进行改写,读入到模型中。

节点的属性特征:例如一个节点可以包括年龄、性别、收入等这些都可以称为属性特征。

节点的连接特征:表述的是一个节点和整个图的其他节点之间的关系。

半监督学习(Semi-Supervised Learning,简称SSL):是一种机器学习范式,它介于监督学习和无监督学习之间。在监督学习中,模型的训练依赖于大量的标记数据,而在无监督学习中,数据通常没有标记。半监督学习则结合了这两者的特点,使用少量的标记数据和大量的未标记数据来进行学习。

        图中给出少量绿色和红色节点然后预测整张图结构的其他未知节点情况。

        下图根据NodeDegree(节点度数)来判断点的情况,A和G都是度数为1,但是A是院士的关门弟子而G是一个小老板的手下的土博,两者是明显不对等的,所以说两者的质量是完全不同的。所以只看NodeDegree是不够全面的

那么怎样避免上面只看数量(度数)不看质量的情况呢?提出了一下方案。

Eigenvector centrality(特征向量中心性):是一种衡量网络中节点重要性的方法。它的核心思想是:如果一个节点连接到许多重要的节点,那么这个节点本身也变得更加重要。这种方法不仅考虑了节点的连接数(即度),还考虑了这些连接的节点的重要性。因此,Eigenvector centrality可以捕捉到网络中的间接连接和节点的全局影响力。

理解为:若一个节点周围的节点很重要则这个节点很重要。

介数中心性(Betweenness Centrality):是网络分析中一个重要的概念,用于衡量网络中节点的重要性。它基于一个节点在所有节点对之间的最短路径上出现的次数来定义。如果一个节点在许多最短路径上充当“桥梁”或“中介”,那么这个节点就具有高介数中心性,这表明它在网络中的信息流通或资源流动中扮演着关键角色。

理解为:一个节点是否处在交通咽喉和必经之地(例如武汉的位置)。

接近中心性(Closeness Centrality):是网络分析中的另一个重要概念,用于衡量网络中节点的重要性。与介数中心性不同,接近中心性关注的是一个节点到网络中所有其他节点的平均距离。一个节点的接近中心性越高,意味着它到其他所有节点的平均距离越短,信息传播到整个网络的速度越快。

理解为:一个节点去其他节点的远近程度。

聚类系数(Clustering Coefficient):是网络分析中用来衡量节点周围局部网络密度的一个指标。它反映了一个节点的邻居节点之间相互连接的程度,即节点的邻居节点形成子图的连通程度。聚类系数可以帮助我们理解网络中的集群或社区结构,即网络中的节点是否倾向于与彼此紧密连接形成群组。

分子是节点V的周围节点之间的相连个数(节点V周围的三角形个数)。分母是V相邻节点的对数。

也叫做ego-network。

Graphlets有根连通导出异构子图(Rooted connected induced non-isomorphic subgraphs)

下图中的【2,1,0,2】的由来:例如第一个2是将图中a点放入u点可以匹配的子图个数其他同理。

本节所讲内容回顾:


http://www.mrgr.cn/news/54557.html

相关文章:

  • Python 自编码器(Autoencoder)算法详解与应用案例
  • 引领智慧文旅新纪元,开启未来旅游新境界
  • 代码随想录算法训练营第三十一天|56. 合并区间、738.单调递增的数字
  • 【C#】MessageBox
  • 胤娲科技:AI大模型的隐秘战争——当“智能”成为双刃剑
  • CMake与Qt4/Qt5的结合使用指南
  • 为图片添加水印(Python)
  • 控制系统 状态观测问题 Kalman卡尔曼(附MATLAB实现)
  • 深入剖析:神经网络的结构与功能解读
  • Monorepo 管理多个包
  • SpringBoot项目整合Knife4J
  • Spark 同步 MySQL 数据到 Hive:技术实践与代码示例
  • Python内存管理入门:理解和优化你的代码
  • 【智能算法应用】徒步优化算法求解二维路径规划问题
  • Nature 正刊丨群体爆发中的神经元序列在人类皮层中编码信息
  • 房子,它或许是沃土
  • STM32传感器模块编程实践(七) MLX90614红外测温模块简介及驱动源码
  • Atlas800昇腾服务器(型号:3000)—CANN安装(二)
  • 【优选算法】探索双指针之美(一):双指针与单调性的完美邂逅
  • 从零开始学PHP之输出语句变量常量
  • 加减乘除计算指令整理
  • uniapp+vue3+uview-plus修改默认样式
  • d3dcompiler_43.dll丢失怎么修复?分享5种实用方法助轻松搞定
  • 有口才的从业者一定是位人才
  • Linux服务器安装SRAToolkit教程
  • 一通瞎写居然击败100%【力扣】【498-对角线遍历】【数组-C语言】