如何判断有向无环图的强度?
好奇什么被认为是判断有向无环图的强度,尤其是某些节点的强度的可靠算法/方法。我对此的主要问题可以归结为以下两个图形:
(如果未显示图形,请单击此处或者访问此链接:http://www.flickr.com/photos/86396568@N00/2893003041/
在我看来,A比a处于更有利的地位。我要根据链接断开后节点可以保留的强度来判断强度。我将第一个称为"高跷",第二个称为"茎"。
到目前为止,这里是我考虑过的用于判断节点强度的方法:
1)计算下面的节点数,减去上面的节点数。
- A = 7,a = 7,B = 5,b = 1
2)计算每个节点的完整路径(到终止)的数量,并求和它们的长度。
- A = 17(1 + 5 + 5 + 5 + 1),B = 12(4 + 4 + 4),a = 9(3 + 3 + 3),b = 2
- 这使高跷更强,而不是茎。
3)计算所有可能的路径,将每个节点都视为目标。
- A = 9(A-> B,A-> C,A-> D,A-> E,A-> G,2xA-> F,2xA-> H),B = 6,a = 9,b = 2个
到目前为止,似乎3是最好的选择,但是对于DAG,有没有更好的选择呢?这是已知最佳方法吗?原理是在图形中使用尽可能多的信息,并以直观的方式说明解决方案。
解决方案
这实际上取决于我们所说的力量。由于DAG在表示信息方面具有多功能性,因此我们可能在讨论从多结果控制流到非副词话语连接词的论点从句甚至是句子中不同单词之间的全套依存关系。
所有这些将以不同的方式查看节点强度。例如,控制流可能会将结果数量最多的节点(因此,向外的弧线最多)视为最强的节点,因为它对图的最终结果具有最大的控制权。在话语中,最强的节点是话语连接词,但在第一个连接词之后和第三个连接词之前的语音和文本中可以找到它。句子的词汇"头"的选择与与其直接相互作用的弧线的数量没有直接关系。
我要说的是,由于术语"强度"的多义性和DAG适合的数据类型,因此在这种数据类型中没有真正的万能药来计算"强度"。我要说的是,在机器学习问题中,所有这三种方法对于选择用于分类或者排序问题的特定节点类型都将非常有用,但是最后,答案取决于数据类型的实际应用。
我认为我们需要更清晰地定义"强度"。这与最大流量问题有关吗?
好的,实际应用是运动队。每个节点都是一个团队,每个环节都是对另一个团队的胜利。假设没有圆形的胜利之路,例如A-> B-> C-> A。目的是获得与图表不冲突的力量排名,并按照球队的实力对球队进行排名。有问题的网站是我的足球网站(有点开玩笑),http://beatpaths.com/,我们可以在其中每周查看整个NFL季节的完整图表。 (以及其他体育运动。)我基本上是在寻找除上面列出的算法以外的排名算法,这种算法可能更有意义,并且可以辩护为使用图中的所有信息。目标不一定是在将来的选秀权上更加准确(尽管可能会有更强大的算法),而是到目前为止要尽可能合理地描述本赛季。
我们可以在网站上看到NFL季的第3周。我删除了两个模棱两可的" beatloop"(长话说),它们依赖于图的其余部分来确定啄食顺序。
如果我们要进行预测,那么最好的选择就是采用最大熵排名算法。问题将是为学习者开发足够大的数据集-越多越好。听起来我们可以将每周游戏的排名用作一个排名实例。