베이 지역 인공 지능 |의 기계 학습 [AI] 전기 공급 사업 컨텍스트

 모델 사양


우리가 비즈니스 상황을 생각해 보자 : 소비자 사이에 특정 소셜 네트워크 구성 네트워크 효과로 소비자에게 특정 상품을 제공하는 독점 640? wx_fmt = JPEG) 인접 행렬 표현을하고, 사회 소비재에서의 소비자 대상 직접 네트워크에 연결되어 다른 소비자 지출 금액에 영향을 미친다. 특히, 소비자 640? wx_fmt = SVG유틸리티입니다

640? wx_fmt = SVG

이는 640? wx_fmt = SVG소비자 인 640? wx_fmt = SVG소비 640? wx_fmt = SVG하고 640? wx_fmt = SVG(경제학자 그것을)되어 관찰 될 수 있고, 관측 요소는 640? wx_fmt = SVG, 네트워크 효과의 정도를 나타내는 640? wx_fmt = SVG소비자를 나타내고 640? wx_fmt = SVG, 및 640? wx_fmt = SVG접속 여부. 소비자가 가격에 직면하는 경우 640? wx_fmt = SVG, 그 소비에 맞게 선택해야합니다

640? wx_fmt = SVG

상기 적층 식 모든 소비자는 인 640? wx_fmt = SVG으로 기록 될 수 있도록 최종 소비 (벡터) 640? wx_fmt = SVG의 조건 중 하나는 매트릭스가 보유하고 640? wx_fmt = SVG충분한 조건은 문헌에 따르면 가역 인접성 매트릭스이고 , 최대 고유치 인접성 매트릭스의 성격에 보여줍니다 따라 그래서 우리는 항상 존재한다고 가정640? wx_fmt = SVG640? wx_fmt = SVG640? wx_fmt = JPEG640? wx_fmt = SVG640? wx_fmt = SVG




 문제 설명


독점 기업의 문제를 해결하기 위해 노력하는 것은, 가격 전략을 개발하기 위해 자신의 이익을 극대화하기 위해 할 수있는 방법입니다 (비용이 제로라고 가정하면, 이익 극대화는 수익을 극대화하는 것과 같습니다). 우리는 긍정적 인 소비 피할 수없는 한계를 고려하지 않고, 각 소비자에 대해 서로 다른 가격이며, 완전한 독점 차별적 가격 (차별적 가격은), 문학 최적의 독점 가격이되어야한다고 제안 허용 640? wx_fmt = SVG하지만, 독점 회사는 직접 관찰 할 수 없다 640? wx_fmt = SVG. 또한, 독점은 일반적으로 네트워크 효과의 크기를 모르는 640? wx_fmt = SVG경우에도 여러 가지 이유로, 독점 제대로 소셜 네트워크의 실제 상황을 관찰 할 수는 640? wx_fmt = SVG있지만, 일부 그들 중은 표시, 관찰 640? wx_fmt = SVG. 모노 폴리는 데이터를 한 번만 사용 가능한 실험 데이터 : 독점 모든 소비자에 대해 동일한 가격을 책정하기 위해, 즉, 균일 한 가격 (균일 가격)을 채택 할 때 640? wx_fmt = SVG, 그것은 소비자의 선택의 소비는 실제 정보를 기반으로 관찰 640? wx_fmt = SVG.

독점이 알고있는 경우 640? wx_fmt = SVG640? wx_fmt = SVG한 다음 반 시작 실험 데이터를 확인할 수 640? wx_fmt = SVG:

640? wx_fmt = SVG

자연 아이디어는 독점 정확하게 가능한 정보를 기반으로 추정 할 수있는 경우이다 640? wx_fmt = SVG640? wx_fmt = SVG다음도 정확하게 추정 할 수 640? wx_fmt = SVG및 대응 최적의 가격.

기존의 문헌은 상기와 같은 문제점을 돕는 더 제한적입니다 :

계량 경제학 문학의 관점에서 정확하게 추정하는 방법에 대한 자세한 우려 640? wx_fmt = SVG일반적으로 관찰 기본 네트워크는 640? wx_fmt = SVG네트워크가 분명히 같은 친구로,없는 경우에도 실제 네트워크이다가 건강 데이터를 추가 조사의 시간에, 기본 다섯 친구의 이름까지 제공하는 응답자 물었다.

예상 또는 실제 네트워크 문서를 조정, 동일한 네트워크 행동의 여러 관측에 종종 의존, 즉 일반적으로 패널 데이터가 필요합니다. 실제로, 몇 가지 테스트는 시간이나 필요한 돈이 제한 될 수 있고 할 수없는, 또는 데이터는 계량 경제학자 자체에만 단면 데이터를 얻을. 하나의 실험이나 단면 데이터에 기초하여 추정하는 경우, 우리는에 직면 640? wx_fmt = SVG추정 한 개인있다 640? wx_fmt = SVG문제 부정 방정식 파라미터.

컴퓨터 과학자 등 우리 편 등의 추가 정보를 사용 (하지 않는 일반적으로 많은 연구가 이러한 종류의 문제는 "링크를 예측"로 알려져 네트워크 문제가있는 것으로 추정하지만, 연고의 비행을 반복 관찰에 대한 많은 연구에도 의존하고있다 실험 결과).

또한,보기의 독점 지점 서, 사실,이 회사는 매개 변수를 상관하지 않는다 640? wx_fmt = SVG하고 640? wx_fmt = SVG올바르게 추정, 반대로, 매개 변수 추정이 정확하지 않은 경우지만, 640? wx_fmt = SVG아직 정확하게 추정 할 수있는, 가격 전략이 올바른지하고 이익을 극대화 할 수 다음 기업은 이러한 추정치는 충분하다. 반대로, 우리는 일반적으로 판단 640? wx_fmt = SVG하고 640? wx_fmt = SVG있는지 여부 "정확한"등의 규범과 기준의 추정, 및 p 값 또는 실제 값 사이 너무 차이가 있지만, 실용적인 의미의 부족.




 견적


우리는 먼저 참조, 나이브 견적라는 우리 추정치와 같은 매우 간단한 추정을 고려한다.

첫째, 진정한 인접 행렬을 관찰 할 수 있다고 가정 640? wx_fmt = SVG, 그것은 추정하는 방법을해야 640? wx_fmt = SVG그것을?

가장 좋은 응답은 이전의 방정식을 다시 작성하는 것입니다 640? wx_fmt = SVG및 수 있도록 우리가이 다음 어디 알려져있다. 우리는 형태의 선형 회귀이 매우 가까운 (그러나 실제로는 선형 회귀의 요구 사항 중 일부를 충족하지 않습니다), 그래서 유사한 선형 회귀 추정치를 사용하는 것이 발견640? wx_fmt = SVG 640? wx_fmt = SVG640? wx_fmt = SVG640? wx_fmt = SVG640? wx_fmt = SVG

640? wx_fmt = SVG

进一步地,公司错误地认为实际观察到的网络640? wx_fmt = SVG就是真实的网络640? wx_fmt = SVG,那么我们就获得了Naive Estimator:640? wx_fmt = SVG 640? wx_fmt = SVG接下来我们看如何在这个问题上运用机器学习。在我之前提的这个问题中:机器学习在理论经济学研究中有哪些可能的应用前景?https://www.zhihu.com/question/320514976

我提到最近了解到哈佛大学Pakes教授利用强化学习来求解拍卖问题的最优投标函数的做法。

对于强化学习,我粗浅的想法是这样的:只要知道游戏规则,那么我们就可以通过不断玩游戏,并通过游戏给予的正负反馈调整玩游戏的方式,来学会如何正确地玩这个游戏。对于我们的模型设定,我们要玩的“游戏”就是从观察到的网络和参数中反推正确的网络和参数,而正负反馈则是根据我们反推/估计的网络和参数所获得的利润而定,接下来就是如何“不断玩游戏”了。如果我们相信我们的模型正确地描述了这个问题(或者说,消费者确实是按照上述是最优反应结合真实参数选择自己的消费量的),那么我们的就可以模拟大量的真实网络和真实参数,然后计算出相应的单次实验结果,然后手动“损坏”网络,并将损坏后的网络和实验结果作为输入,真实网络和真实参数作为输出,通过监督学习的方式训练我们的模型(当然并不一定要用机器学习,一些非参估计的计量方法也是可以的)。

这和以往的计量做法有什么样的区别呢?我的理解是这样的:

利用面板数据进行估计,就好比是和同样的对手玩某个游戏(比如狼人杀),只要玩足够多次,你总能玩得越来越好;但是如果你只能和这个对手玩一次,你想要把这一次玩好该怎么办呢?一个当然的做法就是和不同的对手玩这个游戏,只要玩足够多次,你充分理解这个游戏,那无论对手是谁你都能玩得不错,这就像是强化学习。

具体来说,我们考虑一个朴素神经网络,包括输入层,两个全连接隐藏层(每层8个神经元并采用ReLU激活),最后一个全连接输出层(采用Sigmoid激活),损失函数为自定义的

640? wx_fmt = SVG

优化器采用带默认参数的Adadelta优化器。此外考虑两个变种:

  1. 如果真实网络很稀疏,而观察到的网络和真实网络的差距较小,那意味着两者之差大部分为0。仿照ResNet的想法,我们考虑在输入层和输出层之间直接加一个shortcut path。

  2. 为了和基准的Naive Estimator作对比,我们假设神经网络不对 640? wx_fmt = SVG 作更新而只对网络效应进行估计,但是采用上述自定义损失函数。




 结果与讨论


(由于我们的参数设计似乎有点问题……)即使是Naive Estimator,垄断公司也能够实现超过95%的利润,但神经网络的表现更优一筹,无论是否加上shortcut path,神经网络能够实现99.5%以上的利润(而神经网络只对640? wx_fmt = SVG进行估计的话则和Naive Estimator大致相当)。最极端地情况下,如果我们完全没有网络信息,此时Naive Estimator无法使用,而神经网络仍然能够实现相当的利润(事实上神经网络的表现几乎不随观察到的网络中丢失的连接数量而变化)。

640? wx_fmt = JPEG

但是我们注意到一些奇怪的现象:

1、事实上,上述非常低的利润损失几乎总是伴随着非常不准确的网络和参数估计,估计出的网络和真实网络之间可以有一半以上的结点不同(采用平均绝对误差)。相反,任何试图改善网络和参数估计的做法,比如在损失函数中对网络和参数的错误估计增加惩罚项,都只能轻微地改善估计(甚至还不如直接用观察到的网络)并伴有较高的利润损失。另外,如果只估计参数 640? wx_fmt = SVG ,并且用该估计的均方误差作为损失函数,则我们可以获得非常好的参数估计,而利润损失仍然很大。

我们认为这一现象的根源是,我们估计的是一个non-identification的问题。回到上文:640? wx_fmt = SVG由于我们有太多的未知参数,实际上对于任意的640? wx_fmt = SVG640? wx_fmt = SVG,都存在640? wx_fmt = SVG使得上式成立。

Naive Estimator的做法是,选择640? wx_fmt = SVG最小的那个,但这种选择是有问题的,因为我们的主要目的就是要估计640? wx_fmt = SVG,没有任何理由认为离原点越近的640? wx_fmt = SVG就越正确。

反过来,采用神经网络的这些做法又缺乏一个“如何判定哪种估计更正确”的“真实规则”,这导致了其最终学到的是一个混合了所有可能性的“四不像”。

2、一开始我们尝试了每层128个神经元,结果训练结果要差得多,而且随着epochs增加,loss反而上升了。这可能主要是因为上面所说的identification的问题,但我猜测是否随着神经元数量增加,待训练参数增加,损失函数上出现了更多鞍点或局部极值的情况。

3、如果我们将邻接矩阵看作是二进制图象,那么我们这里的问题相当于根据额外信息恢复一个破损/带有噪音的二进制图像。我们尝试加上了卷积层和池化层,但是和上一条类似,训练结果反而变差了。另外,邻接矩阵本身和一般的二进制图像也并不相同,比如邻接矩阵中某个结点的一些拓扑信息和邻接矩阵在局部的表现(比如,个别点之间的连接情况无关),而是跟某个结点和其它所有结点的连接情况有关(比如度)。我注意到BrainNetCNN可能更适用于这个问题。




 总结


尽管我们开始于一个非常具体的案例,但本文的重点并不在于如何帮助垄断公司定价,而是以此为例说明,机器学习在商业(或者其它社会经济)情境中可能的运用方法和问题。

类似于我们所举的场景的例子在现实中很常见,它包含有以下要素:

  1. 存在一些信息丢失,可能是无法观察,也可能是测量误差;

  2. 간접적 인 수단으로이 정보를 감지,하지만 너무 많은 자유 때문에 완벽한 복구 정보로 이어질 수 없습니다;

  3. 사용 빈도를 제한하고, 따라서 이러한 수단의 존재는 반복 될 수 없다.

  4. 누락 된 정보는 추가 사용되며, 사용시 명확한 기준을 동반한다.

  5. 우리는 우리의 모델이 올바르게 정보의 감지 및 처리 정보를 추가 사용하는 프로세스에 대해 설명합니다 있다고 생각합니다.

상업 정책의 많은 고정 소수점 실험 또는 테스트 작업은 이러한 특성과 일치한다. 이러한 요소에) 5 특히 기본, 우리가 수동 모델 시뮬레이션 데이터를 사용하여 연습을 유사한 기사를 고려할 수있는 정보의 일부를 "손실", 배우고 훈련하는지도 학습의 사용은 우리를 도달하기 위해 정보의 손실을 "다시"하는 방법을 모델로 목적 (오히려 그냥 "올바른"정보를 재건보다는 - 대신 더 나은 때로는 "오류"메시지).


----- END -----



@ 리차드 쑤

저작권

이 문서에서는 자신의 연락처를 다시 인쇄, "리처드 쑤을"에 속한다.



편지는 학교에서 AI 학생들로 전환


[AI] 완전한 AI의 자기 학습 과정, 가장 상세한 자원 통합!


AI 스위치는 기사의 일부 볼 필요가


AI 내용을 전환하는 방법, 일선 엔지니어 통찰력을 특정 세그먼트의 방향을 선택합니다


법률 무기로, 텐센트 침해를 날려! ! ! 베이 지역 인공 지능은 지적 재산권 그것의 상태를 향상시킬 수 있습니까?


[PDF] 항목에서 책 파이썬 프로그래밍을 보내려면 연습


마스터 입장에서 파이썬, 학습과 기계 학습 자료 마구의 깊이!


[무료] (200 개) 사본 최신 대용량 데이터의 / 물론 고속 다운로드 3,980위안 기계 학습, 제한된 기관


640? wx_fmt = PNG


640? wx_fmt = PNG



640? wx_fmt = PNG


 , 전달하는 자유 기분이 좋아 기분이 문제 명소 봐!




추천

출처blog.csdn.net/BTUJACK/article/details/91473372