-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathlocal-search.xml
128 lines (61 loc) · 40.3 KB
/
local-search.xml
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
<?xml version="1.0" encoding="utf-8"?>
<search>
<entry>
<title>个人博客搭建报告</title>
<link href="/2024/04/11/%E5%8D%9A%E5%AE%A2%E6%90%AD%E5%BB%BA%E6%8A%A5%E5%91%8A/"/>
<url>/2024/04/11/%E5%8D%9A%E5%AE%A2%E6%90%AD%E5%BB%BA%E6%8A%A5%E5%91%8A/</url>
<content type="html"><![CDATA[<meta name="referrer" content="no-referrer"/><p>汇集了遇到的问题与解决方式</p><span id="more"></span><h1 id="博客搭建报告"><a href="#博客搭建报告" class="headerlink" title="博客搭建报告"></a>博客搭建报告</h1><h2 id="作业目标"><a href="#作业目标" class="headerlink" title="作业目标"></a>作业目标</h2><h3 id="内容"><a href="#内容" class="headerlink" title="内容"></a>内容</h3><p>选择一个感兴趣或擅长的主题来制作一个静态网页博客,比如个人介绍、爱好分享、技术总结等。</p><h3 id="要求:"><a href="#要求:" class="headerlink" title="要求:"></a>要求:</h3><ul><li>设计至少四个页面来展示博客内容,不限于首页、关于我、文章列表、文章详情等。</li><li>博客排版清晰、内容合理,代码整洁优雅,可读性强。</li><li>附上自己对本次作业的总结及反思,包括但不限于以下内容:(可以放在博客中) <ul><li>博客主题及其选取原因</li><li>博客页面布局及其设计思路</li><li>博客功能实现及其技术选择</li><li>博客制作过程中遇到的问题及其解决方法</li></ul></li></ul><h2 id="技术方案"><a href="#技术方案" class="headerlink" title="技术方案"></a>技术方案</h2><p>Hexo 框架 Github page<br>Hexo 主题:<a href="https://github.com/fluid-dev/hexo-theme-fluid">Fluid</a>( 一款 Material Design 风格的主题)<br>使用手册:[Hexo Fluid](<a href="https://hexo.fluid-dev.com/docs/start/">开始使用 | Hexo Fluid 用户手册 (fluid-dev.com)</a>)<br>根据使用手册,递归学习博客搭建所需的技术。包括但不限于:Hexo、npm、Fluid 等等。根据手册使用并修改过程中几乎不会有什么大问题</p><h2 id="页面设计"><a href="#页面设计" class="headerlink" title="页面设计"></a>页面设计</h2><p>主页,详情见实际博客连接<br><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1712821244212-1a7f8027-77b2-4307-a99f-87670053a9ad.png#averageHue=%23685d48&clientId=u0b9e08e5-a637-4&from=paste&height=739&id=uc1cde0c1&originHeight=1477&originWidth=2696&originalType=binary&ratio=2&rotation=0&showTitle=false&size=6864806&status=done&style=none&taskId=ub6317cd6-48fd-4f29-9367-1ff43ff87ac&title=&width=1348" alt="image.png"><br>博客分为首页,归档,分类、标签和关于等模块。<br>首页:展示一定数量的博客,所有博客在归档可以有清晰的展示<br>归档:对所有博客以日期进行归档划分<br><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1712821356129-48c5ea8a-f5e3-4c44-b57d-0ff3d08039f3.png#averageHue=%23395a38&clientId=u0b9e08e5-a637-4&from=paste&height=737&id=u59662ad5&originHeight=1473&originWidth=2643&originalType=binary&ratio=2&rotation=0&showTitle=false&size=4771660&status=done&style=none&taskId=ufdce1280-1dc2-4ee6-81f4-ad2d7122418&title=&width=1321.5" alt="image.png"><br>分类:根据文章的 categories 值进行划分,方便分类查阅<br>标签:类似分类页,可依据标签页进行方便的查找<br>关于:自我展示页<br><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1712821603469-72690ef2-4361-4799-bbb8-6f5cecfd17f3.png#averageHue=%232f5134&clientId=u0b9e08e5-a637-4&from=paste&height=725&id=uc0f9ea03&originHeight=1449&originWidth=2726&originalType=binary&ratio=2&rotation=0&showTitle=false&size=5868843&status=done&style=none&taskId=u13a74cf7-d75f-4a9a-af1b-fb8db3d90db&title=&width=1363" alt="image.png"></p><h2 id="功能介绍"><a href="#功能介绍" class="headerlink" title="功能介绍"></a>功能介绍</h2><ul><li>每个标签页和博客也,有打字机 slogan 效果,问题跳动展示,例如上文首页的 “Hi I’m Tenth-crew”</li><li>白天黑夜模式切换(可随系统自动切换</li><li>个人页与 Github 连接</li><li>文章计数</li><li>标签实现词云效果,比例越重的标签,其显示效果越大</li><li>全博客关键字搜索功能</li></ul><p><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1712821990348-f12ef32a-e37f-4c4e-8455-d71a26db8db3.png#averageHue=%23f8f8f7&clientId=u0b9e08e5-a637-4&from=paste&height=478&id=ub62ccc43&originHeight=955&originWidth=1622&originalType=binary&ratio=2&rotation=0&showTitle=false&size=245222&status=done&style=none&taskId=ufa67b6b6-bb61-4720-9ea0-a723e346ac1&title=&width=811" alt="image.png"></p><h2 id="部署时遇到的问题及解决措施"><a href="#部署时遇到的问题及解决措施" class="headerlink" title="部署时遇到的问题及解决措施"></a>部署时遇到的问题及解决措施</h2><h3 id="jekyll实践更复杂"><a href="#jekyll实践更复杂" class="headerlink" title="jekyll实践更复杂"></a>jekyll实践更复杂</h3><p>在实际有一定美观效果的主题中,所需要的工具过于繁杂,且不易于获取。几乎全英文的阅读环境对工作进展有一定的阻碍。<br>因此之后选择了 Hexo 作为搭建方案。本次检查更加方便,且得益于其框架的优越性,渲染极快,对开发速度有很好的帮助。另外 Hexo 官方提供中文文档,民间开源组织与主题也更丰富。</p><h3 id="Hexo-一键部署方式阻碍"><a href="#Hexo-一键部署方式阻碍" class="headerlink" title="Hexo 一键部署方式阻碍"></a>Hexo 一键部署方式阻碍</h3><p>在跟随文档进行工作调整配置文件时几乎没有遇到问题,但是跟着官方文档的一键部署方式我失败了,并且没有找到原因。<br>参考 <a href="%5Bhttps://blog.csdn.net/yaorongke/article/details/119089190%5D(https://blog.csdn.net/yaorongke/article/details/119089190)">CSDN 博客</a> 中的部署方式2。将文件夹 public 的内容上传到同名仓库完成搭建。</p><h3 id="如何进行后续更新"><a href="#如何进行后续更新" class="headerlink" title="如何进行后续更新"></a>如何进行后续更新</h3><p>在本地完成对博文的修改后,在与 public 的同级目录下执行 hexo g 的命令完成静态网页更新。此时 public 的文件会完成更新,即可通过 git 的方式同步到 github 仓库。</p>]]></content>
<categories>
<category>homework</category>
</categories>
<tags>
<tag>study</tag>
<tag>Homework</tag>
</tags>
</entry>
<entry>
<title>数据集论文写作研究</title>
<link href="/2024/04/11/%E6%95%B0%E6%8D%AE%E9%9B%86%E8%AE%BA%E6%96%87%E5%86%99%E4%BD%9C%E7%A0%94%E7%A9%B6/"/>
<url>/2024/04/11/%E6%95%B0%E6%8D%AE%E9%9B%86%E8%AE%BA%E6%96%87%E5%86%99%E4%BD%9C%E7%A0%94%E7%A9%B6/</url>
<content type="html"><![CDATA[<meta name="referrer" content="no-referrer"/><p>如何撰写一篇数据集论文</p><span id="more"></span><h2 id="参考论文"><a href="#参考论文" class="headerlink" title="参考论文"></a>参考论文</h2><p>DeepScenario: An Open Driving Scenario Dataset for Autonomous Driving System Testing<br>GIRT-Data: Sampling GitHub Issue Report Templates</p><h2 id="1-Abstract"><a href="#1-Abstract" class="headerlink" title="1.Abstract"></a>1.Abstract</h2><p>背景:技术发展,研究需要<br>原因:为什么需要数据集(时间,资源,实际测试的困难)<br>介绍:简要介绍数据集,不必过于具体,大概数据量,如何收集的,大概构成(可以针对一个情形举例)<br>用途:帮助开发者测试产品或科研,或者是为了推广某种更好的标准</p><h2 id="2-Key-word"><a href="#2-Key-word" class="headerlink" title="2.Key word"></a>2.Key word</h2><p>略</p><h2 id="3-Introduction"><a href="#3-Introduction" class="headerlink" title="3.Introduction"></a>3.Introduction</h2><p>对摘要的扩写<br>1.首先详细介绍背景和原因,为什么要有这个数据集,原本没有数据集的情况多困难?<br>2.介绍已经有的数据集,指出现有数据集的不足(太片面?缺少其他信息?)<br>3.介绍自己的数据集,与之前的数据集不一样的点<br>3.1 本文研究可能遇到的困难(实际上就是自己解决的困难)<br>4.本论文的贡献</p><h2 id="4-Methodology(The-DataSet)"><a href="#4-Methodology(The-DataSet)" class="headerlink" title="4.Methodology(The DataSet)"></a>4.Methodology(The DataSet)</h2><p>0.这里主要说的制作方法(如果以The DataSet命名,4和5应该就合并一起写了)<br>1.数据集制作方法总览,最好有总览图,接着详细介绍方法的每一步,这里是针对自己生成数据集的方法(数据提取过程,主要是面向收集来的数据,对收集方法详细介绍,比如确定搜索目标,搜索目标的特点,收集工具)<br>2.数据集生成的配置方法,原理方法的介绍(测试性地搜索数据,分析分布或关联)<br>3.正式测试前的测试设置(如有),讲清楚自己在何种情形下测试。以及测试执行的方法<br>4.数据集生成(根据配置条件和结果组成record)</p><h2 id="5-Description"><a href="#5-Description" class="headerlink" title="5.Description"></a>5.Description</h2><p>1.对数据集的准确描述,在我看的第一篇论文中,首先对使用场景的场景做了定义,或许开源社区数据集首先也要对开源社区做出定义,并对智能问答的场景做出严谨的描述。<br>2.数据集详细介绍<br>2.1 数据量介绍,如果有些条件的数据量较少,解释原因,贴上数据集的overview<br>2.2 数据分布,介绍哪些情况比较多,哪些比较少,原因是什么。比如根据属性一有什么分布,根据属性二有什么分布,这里可以选取比较重要的属性进行介绍,贴上分布图并解释原因。<br>2.3 具体的介绍属性(前面也有属性介绍,但是这里最具体)<br>2.4 可以更具体地针对一个属性进行分布分析</p><h2 id="6-Usage-and-limitation"><a href="#6-Usage-and-limitation" class="headerlink" title="6.Usage and limitation"></a>6.Usage and limitation</h2><p>1.详细丰富地介绍使用场景<br>2.数据集的缺陷</p><h2 id="7-Conclusion"><a href="#7-Conclusion" class="headerlink" title="7.Conclusion"></a>7.Conclusion</h2><p>类似于introduction</p>]]></content>
<categories>
<category>study</category>
</categories>
<tags>
<tag>study,report</tag>
<tag>study,PaperReading</tag>
</tags>
</entry>
<entry>
<title>AI: from Article to Image</title>
<link href="/2024/04/11/AI-from-Article-to-Image/"/>
<url>/2024/04/11/AI-from-Article-to-Image/</url>
<content type="html"><![CDATA[<meta name="referrer" content="no-referrer"/><p>在如今的数字化时代,大量的文本内容被创建和共享。然而,有时候文字无法直观地传达信息,而图像则能够更好地传达复杂的概念和情感。本项目旨在利用人工智能技术,将给定的文章转化为相应的图像,以提供更直观和易于理解的信息传递方式。</p><span id="more"></span><h2 id="1-项目设计"><a href="#1-项目设计" class="headerlink" title="1.项目设计"></a>1.项目设计</h2><h3 id="1-1-项目背景和目标"><a href="#1-1-项目背景和目标" class="headerlink" title="1.1 项目背景和目标"></a>1.1 项目背景和目标</h3><p>在如今的数字化时代,大量的文本内容被创建和共享。然而,有时候文字无法直观地传达信息,而图像则能够更好地传达复杂的概念和情感。本项目旨在利用人工智能技术,将给定的文章转化为相应的图像,以提供更直观和易于理解的信息传递方式。</p><h3 id="2-技术架构"><a href="#2-技术架构" class="headerlink" title="2 技术架构"></a>2 技术架构</h3><h4 id="2-1-摘要生成"><a href="#2-1-摘要生成" class="headerlink" title="2.1 摘要生成"></a>2.1 摘要生成</h4><p>摘要生成使用的模型是 BART (Bidirectional and Auto-Regressive Transformers)。BART 是一种序列到序列的 Transformer 模型。在实际过程中,我们通过使用 HUgging Face 的“ BartForConditionalGeneration ”类加载了一个预训练的 BART 模型,然后对给定的文章进行摘要生成。</p><h4 id="2-2-图片生成"><a href="#2-2-图片生成" class="headerlink" title="2.2 图片生成"></a>2.2 图片生成</h4><p>本项目使用了稳定扩散(Stable Diffusion)模型来生成图像。<br>模型选择了DPMSolverMultistepScheduler来作为稳定扩散模型的调度器。<br><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1711167956115-0b6efed3-0ef9-4b72-ac01-9a02f9a002a3.png#averageHue=%23e8cca8&clientId=u50a7ec6c-5997-4&from=paste&height=657&id=u7bdbd575&originHeight=657&originWidth=1572&originalType=binary&ratio=1&rotation=0&showTitle=false&size=154334&status=done&style=none&taskId=u222f2e91-6ebe-4feb-969b-dc8ffe3910c&title=&width=1572" alt="image.png"></p><h4 id="2-3-优化与加载"><a href="#2-3-优化与加载" class="headerlink" title="2.3 优化与加载"></a>2.3 优化与加载</h4><p>使用<strong>Intel</strong>提供的<strong>Bigdl库</strong>低内存模式(low memory mode)来初始化Bart模型,以节省内存。加载了预训练的Bart模型的低位参数。使得运行速度得以提升。</p><h4 id="2-4-工作流程"><a href="#2-4-工作流程" class="headerlink" title="2.4 工作流程"></a>2.4 工作流程</h4><p>针对文章数据Article进行文本总结得到Summarize,得到图片生成模型可以理解的 prompt 从而是的图片可以被顺利生成。<br><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1711170405210-6ba5cf0c-5376-43fa-88b1-e99ccd85bcee.png#averageHue=%23f7f7f7&clientId=u50a7ec6c-5997-4&from=paste&height=460&id=u6ecf219e&originHeight=460&originWidth=696&originalType=binary&ratio=1&rotation=0&showTitle=false&size=24533&status=done&style=none&taskId=ub7af935a-e335-424d-9e85-ffd5115127f&title=&width=696" alt="image.png"></p><h3 id="3-应用方向"><a href="#3-应用方向" class="headerlink" title="3 应用方向"></a>3 应用方向</h3><p>主要应用方向为文章总结以及文生图,为新闻或者其他文字内容产生合适的配图。例如我们为宇航员在太空骑马进行了配图模拟,模拟结果如下。<br><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1711170843079-a83c85d4-dc9b-4a2f-b195-ec8f0b4c2890.png#averageHue=%23886349&clientId=u50a7ec6c-5997-4&from=drop&id=uc93bb845&originHeight=512&originWidth=512&originalType=binary&ratio=1&rotation=0&showTitle=false&size=401120&status=done&style=none&taskId=u758de0e1-4c35-4821-b7c1-2bce5d73fe1&title=" alt="astronaut_rides_horse.png"></p><h3 id="4-Intel加速"><a href="#4-Intel加速" class="headerlink" title="4 Intel加速"></a>4 Intel加速</h3><p>我们通过使用<strong>Intel</strong>提供的<strong>Bigdl库</strong>低内存模式(low memory mode)来初始化Bart模型,以节省内存。加载了预训练的Bart模型的低位参数。使得运行速度得以提升。以下是我们使用程序运行的演示结果,运行时间24min。<br>首先我们输入如下文章<br>Trump’s lawyers acknowledged Monday that he was struggling to find an insurance company willing to underwrite his $454 million bond. Privately, Trump had been counting on Chubb, which underwrote his $91.6 million bond to cover the E. Jean Carroll judgment, to come through, but the insurance giant informed his attorneys in the last several days that that option was off the table.<br>Trump’s team has sought out wealthy supporters and weighed what assets could be sold – and fast. The presumptive GOP presidential nominee himself has become increasingly concerned about the optics the March 25 deadline could present – especially the prospect that someone whose identity has long been tied to his wealth would confront financial crisis. Trump has continued to privately lash out at the New York Attorney General Letitia James and Judge Arthur Engoron over the matter, these sources told CNN.<br>Shortly before 6:30 a.m. Tuesday, Trump took those grievances public, posting on his social media platform eight times within two hours about the deadline, arguing that he shouldn’t have to put up the money and worrying that he “would be forced to mortgage or sell Great Assets, perhaps at Fire Sale prices, and if and when I win the Appeal, they would be gone.”<br>“Does that make sense? WITCH HUNT. ELECTION INTERFERENCE!” the former president wrote.<br>“These baseless innuendos are pure bullsh*t,” Trump campaign spokesman Steven Cheung said in a statement Tuesday. “President Trump has filed a motion to stay the unjust, unconstitutional, un-American judgment from New York Judge Arthur Engoron in a political Witch Hunt brought by a corrupt Attorney General. A bond of this size would be an abuse of the law, contradict bedrock principals of our Republic, and fundamentally undermine the rule of law in New York.<br>得到如下摘要和图片。<br><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1711181949497-e2244ba9-757e-4113-ae58-a21a18e72006.png#averageHue=%23966f56&clientId=u0637c5e0-7f23-4&from=drop&id=uaa754c8b&originHeight=1010&originWidth=714&originalType=binary&ratio=1&rotation=0&showTitle=false&size=1155849&status=done&style=none&taskId=u0456bfae-7d70-484b-ae10-46de659638a&title=" alt="b14ed6a16f9a441377523f9572af1804.png"></p>]]></content>
<categories>
<category>study</category>
</categories>
<tags>
<tag>study</tag>
<tag>report</tag>
</tags>
</entry>
<entry>
<title>OpenRank</title>
<link href="/2024/04/11/OpenRank/"/>
<url>/2024/04/11/OpenRank/</url>
<content type="html"><![CDATA[<meta name="referrer" content="no-referrer"/><p>Openrank是一个开源贡献评价指标,这是我的学习记录</p><span id="more"></span><h2 id=""><a href="#" class="headerlink" title=""></a><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1708583727048-4e3eadde-d91a-45fd-b148-c0d52d2e9bc0.png#averageHue=%2314181f&clientId=uea71e7c1-2f2b-4&from=paste&height=225&id=u547d23a8&originHeight=281&originWidth=715&originalType=binary&ratio=1.25&rotation=0&showTitle=false&size=132003&status=done&style=none&taskId=ua3111d78-129b-4c83-bf61-72db9874edf&title=&width=572" alt="image.png"></h2><h2 id="马尔科夫链"><a href="#马尔科夫链" class="headerlink" title="马尔科夫链"></a>马尔科夫链</h2><p><a href="https://zh.wikipedia.org/wiki/%E9%A9%AC%E5%B0%94%E5%8F%AF%E5%A4%AB%E9%93%BE">https://zh.wikipedia.org/wiki/%E9%A9%AC%E5%B0%94%E5%8F%AF%E5%A4%AB%E9%93%BE</a><br>马尔可夫链是满足马尔可夫性质的<a href="https://zh.wikipedia.org/wiki/%E9%9A%8F%E6%9C%BA%E5%8F%98%E9%87%8F">随机变量</a>序列_X_1, _X_2, <em>X_3, …,即给出当前状态,将来状态和过去状态是相互独立的。从形式上看<br><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1708592032392-b7b491e8-ff80-4c1c-abec-c246244ec66b.png#averageHue=%23f0f0f0&clientId=uea71e7c1-2f2b-4&from=paste&height=49&id=u0ccc2b6d&originHeight=69&originWidth=795&originalType=binary&ratio=1.25&rotation=0&showTitle=false&size=15748&status=done&style=none&taskId=ue987b6ff-fba2-4a17-a0e5-705bf308ba2&title=&width=567.5" alt="image.png"><br>Xi的可能值构成可数集S,叫做该链的“状态空间”。<br>通常用一系列<a href="https://zh.wikipedia.org/wiki/%E6%9C%89%E5%90%91%E5%9B%BE">有向图</a>来描述马尔可夫链,其中图_n_的边用从时刻_n_的状态到时刻_n+1_的状态的概率<img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1708592269627-c5d19925-b159-4448-976f-1a230a3cea25.png#averageHue=%23e8e8e8&clientId=uea71e7c1-2f2b-4&from=paste&height=16&id=u2b50f57b&originHeight=29&originWidth=256&originalType=binary&ratio=1.25&rotation=0&showTitle=false&size=2925&status=done&style=none&taskId=u82ccc298-4011-4da4-84f0-69bfac2cc9b&title=&width=143" alt="image.png">来标记。也可以用从时刻_n_到时刻_n+1_的<a href="https://zh.wikipedia.org/wiki/%E8%BD%89%E7%A7%BB%E7%9F%A9%E9%99%A3">转移矩阵</a>表示同样的信息。但是,马氏链常常被假定为时齐的(见下文的变种),在这种情况下,图和矩阵与_n_无关,因此也不表现为序列。<br><strong>变种</strong>:<strong>时齐马尔可夫链</strong>(或<strong>静态马尔可夫链</strong>)是对于所有_n:</em><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1708592323322-c7dc144b-d314-4c7a-8b19-ff9fbf44505c.png#averageHue=%23ededed&clientId=uea71e7c1-2f2b-4&from=paste&height=21&id=u1e1034c0&originHeight=37&originWidth=518&originalType=binary&ratio=1.25&rotation=0&showTitle=false&size=5149&status=done&style=none&taskId=u519a60aa-9e62-46e1-a133-5d6acdf6cc1&title=&width=301" alt="image.png">转移过程与n无关。</p><h2 id="PageRank"><a href="#PageRank" class="headerlink" title="PageRank"></a>PageRank</h2><p><a href="https://zhuanlan.zhihu.com/p/137561088">https://zhuanlan.zhihu.com/p/137561088</a><br>朴素观念:其他网站导向某一个网站的链接越多,说明后者就愈重要。<br>转移矩阵:以下图的网络所示<br><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1708590243976-2da7249d-e373-4456-bc0f-a4cff408217a.png#averageHue=%23f7f7f7&clientId=uea71e7c1-2f2b-4&from=paste&height=139&id=uccc29a5d&originHeight=278&originWidth=335&originalType=binary&ratio=1.25&rotation=0&showTitle=false&size=17247&status=done&style=none&taskId=ued6affe0-c747-4015-be45-03580e86a72&title=&width=167.5" alt="image.png"><br>转移矩阵按列写,A到B、C是1/2,到自己为0。一次类推写出随机游走矩阵。<br><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1708590562346-08851aca-7eb8-49d3-b14d-c319c3a46611.png#averageHue=%23f9f9f9&clientId=uea71e7c1-2f2b-4&from=paste&height=84&id=u8d89efd6&originHeight=128&originWidth=256&originalType=binary&ratio=1.25&rotation=0&showTitle=false&size=5755&status=done&style=none&taskId=u16dc24e7-570b-432e-8c39-f907b6975cb&title=&width=168" alt="image.png"><br>基础的Pagerank由此定义。随机游走在某个时刻t访问各个结点的概率分布是马尔科夫链时刻t的状态分布,可以用一个n维列向量Rt表示,那么下一时刻的概率分布为:<br><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1708590679842-3d303578-b52e-45e1-bc27-cea46b94563c.png#averageHue=%23fbfbfb&clientId=uea71e7c1-2f2b-4&from=paste&height=44&id=u966db1f0&originHeight=61&originWidth=203&originalType=binary&ratio=1.25&rotation=0&showTitle=false&size=2492&status=done&style=none&taskId=u81aa8531-dd89-4127-b0e5-a5ac1d23a86&title=&width=145.5" alt="image.png"><br>则极限存在,极限为:<br><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1708590707865-34309f86-18b8-4289-b56c-385ad686b7ed.png#averageHue=%23fbfbfb&clientId=uea71e7c1-2f2b-4&from=paste&height=56&id=uc1ae4d4f&originHeight=77&originWidth=240&originalType=binary&ratio=1.25&rotation=0&showTitle=false&size=3634&status=done&style=none&taskId=ub14547c1-3c78-4bd6-8bc2-6f531970cf6&title=&width=173" alt="image.png"><br>极限向量 <strong>MR=R</strong><br>这个平稳分布的各个分量为各个节点的PageRank值<br><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1708590851936-ecc32376-af90-4c6d-9c66-c4053cd2205f.png#averageHue=%23f9f9f9&clientId=uea71e7c1-2f2b-4&from=paste&height=139&id=u61152b57&originHeight=196&originWidth=237&originalType=binary&ratio=1.25&rotation=0&showTitle=false&size=8413&status=done&style=none&taskId=u9e8895c5-ad85-4771-ba17-a374a54f5cf&title=&width=167.5" alt="image.png"><br>有如下性质:<br><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1708590965111-0a66f22c-728f-47f5-83b0-fe335ba5bf52.png#averageHue=%23fdfdfd&clientId=uea71e7c1-2f2b-4&from=paste&height=173&id=u1a082235&originHeight=280&originWidth=531&originalType=binary&ratio=1.25&rotation=0&showTitle=false&size=19416&status=done&style=none&taskId=ubc820e97-2bae-449b-ae8b-69b4499a92c&title=&width=327.5" alt="image.png"><br><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1708590985319-3b7f8a35-0753-4c54-9f18-c92327d76639.png#averageHue=%23fbfaf8&clientId=uea71e7c1-2f2b-4&from=paste&height=90&id=ud1fc70c8&originHeight=139&originWidth=877&originalType=binary&ratio=1.25&rotation=0&showTitle=false&size=23236&status=done&style=none&taskId=u1f68d6d1-35df-4f7c-a4c8-963be594a33&title=&width=569.5" alt="image.png"><br>**定理1 **不可约且非周期的有限状态马尔可夫链,有唯一平稳分布存在,并且 当时间趋于无穷时状态分布收敛于唯一的平稳分布。</p><hr><p>上面介绍的是基础定义的PageRank,下面介绍<strong>一般定义的PageRank</strong><br>PageRank 一般定义的想法是在基本定义的基础上导入平滑项。<br><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1708591164521-85c217bb-9d0f-4eb7-8e09-4de350d1f073.png#averageHue=%23fbf9f7&clientId=uea71e7c1-2f2b-4&from=paste&height=200&id=uf3c32468&originHeight=301&originWidth=913&originalType=binary&ratio=1.25&rotation=0&showTitle=false&size=58645&status=done&style=none&taskId=uf2cfe7a2-4b12-493b-b26b-53f711f4c01&title=&width=605.5" alt="image.png"><br>阻尼因子d由经验决定,当d接近1的时候,随机游走主要按照M进行,当d接近0的时候,随机游走主要以等概率随机访问各个结点。<br><strong>由于采用平滑项,所有节点的PageRank的值都不会为0</strong>,具有以下性质<br><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1708591443738-0e686a83-116b-42b6-95e9-e6189c103499.png#averageHue=%23fcfcfc&clientId=uea71e7c1-2f2b-4&from=paste&height=127&id=u5b5c889a&originHeight=178&originWidth=402&originalType=binary&ratio=1.25&rotation=0&showTitle=false&size=9234&status=done&style=none&taskId=uf4634f39-3f5d-4ab1-9a8d-7c864c0bce1&title=&width=286" alt="image.png"><br>一般 PageRank 的定义意味着互联网浏览者,按照以下方法在网上随机游走:任意一个网页上,浏览者或者以概率 d 决定按照超链接随机跳转,这时以等概率从连接出去的超链接跳转到下一个网页;或者以概率 (1-d) 决定完全随机跳转,这时以等概率 1/n 跳转到任意一个网页。 第二个机制保证从没有连接出去的超链接的网页也可以跳转出。这样可以保证平稳分布,即一般 PageRank 的存在,因而一般 PageRank 适用于任何结构的网络。</p><h2 id="异质图(异质信息网络)"><a href="#异质图(异质信息网络)" class="headerlink" title="异质图(异质信息网络)"></a>异质图(异质信息网络)</h2><p><a href="https://baike.baidu.com/item/%E5%BC%82%E8%B4%A8%E4%BF%A1%E6%81%AF%E7%BD%91%E7%BB%9C/22138885">https://baike.baidu.com/item/%E5%BC%82%E8%B4%A8%E4%BF%A1%E6%81%AF%E7%BD%91%E7%BB%9C/22138885</a><br>异质信息网络是一种信息网络,包含了节点和边,并且该节点和边具有一种或多种类型,异质信息网络包含了更更丰富的语义信息。<br>信息网络被定义为一个有向网络图G=(V,E),其中,V是所有实体结点的集合,E是所有关系边的集合。并且存在着一个结点类型的映射函数φ:V→A和一个边类型的映射函数Ψ:E→R,对于每个对象v∈V属于一种特殊的对象类型φ(v)∈A,每个链接e∈E属于一种特殊的关系类型Ψ(e)∈R,那么这种网络类型就是信息网络。当对象类型的种类|A|>1或者关系类型的种类|R|>1时,这种信息网络是异质信息网络,否则,它是一种同质信息网络 [1]。</p><ul><li>1Han J. Mining heterogeneous information networks: the next frontier[C]// ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. ACM, 2012:2-3.</li></ul><h2 id="Louvain社区发现算法"><a href="#Louvain社区发现算法" class="headerlink" title="Louvain社区发现算法"></a>Louvain社区发现算法</h2><p><a href="https://zhuanlan.zhihu.com/p/556291759">https://zhuanlan.zhihu.com/p/556291759</a><br>很感谢研一上学到的课程知识<br>基于贪心原理的</p><ol><li>把每一个点视为一个一个小社区</li><li>把点不断尝试加入其他节点,看加入哪一个可以使得社区变化度最高。</li><li>遍历完一遍后将每个社区压缩为一个新的超级节点,超节点的权重又社区内部的权重求和作为超节点自环的权重,超节点之间的社区存在边,将其权重求和作为超节点之间的权重。</li><li>不断循环这一过程,知道社区模块度不再变大。</li></ol><h2 id="在异质信息网络上如何保证pagerank的收敛"><a href="#在异质信息网络上如何保证pagerank的收敛" class="headerlink" title="在异质信息网络上如何保证pagerank的收敛"></a>在异质信息网络上如何保证pagerank的收敛</h2><h2 id="数学理论中的符号与定义"><a href="#数学理论中的符号与定义" class="headerlink" title="数学理论中的符号与定义"></a>数学理论中的符号与定义</h2><p><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1708585493058-0e8606a2-f9d3-43d6-a29a-081e2c9e9ec5.png#averageHue=%23151b24&clientId=uea71e7c1-2f2b-4&from=paste&height=298&id=uc8e4871e&originHeight=595&originWidth=1211&originalType=binary&ratio=1.25&rotation=0&showTitle=false&size=702955&status=done&style=none&taskId=uf74c3e69-f77d-407b-bec2-99d49015cbe&title=&width=605.5" alt="image.png"></p><h2 id="中心性"><a href="#中心性" class="headerlink" title="中心性"></a>中心性</h2><p><a href="https://blog.csdn.net/yyl424525/article/details/103108506">https://blog.csdn.net/yyl424525/article/details/103108506</a><br>在图论和网络分析中,<strong>中心性(Centrality)是判断网络中节点重要性/影响力的指标</strong>。</p><ul><li>点度中心性:在无向网络中,我们可以用一个节点的度数来衡量中心性。</li><li>中介中心性(betweenness):简单的节点betweeness是计算所有最短路径经过这个节点的次数。这里的betweeness不是简单的计数,<strong>而是要把经过该节点的最短路径数除以所有的最短路径总数,这个比值作为该节点的中介中心性。</strong></li></ul><p>首先,我们计算节点D之外,所有节点对之间的最短路径有多少条,这里是15条(在6个节点中选择两个节点即节点对的个数)。<br>然后,我们再看所有这些最短路径中有多少条经过节点D,例如节点A要想找到节点E,必须经过节点D。经过节点D的最短路径有9条。<br>最后,我们用经过节点D的最短路径除以所有节点对的最短路径总数,这个比率就是节点D的中介中心性。节点D的中介中心性是9/15=0.6。</p><ul><li>接近中心性(closeness):<strong>如果节点到图中其他节点的最短距离都很小,那么它的接近中心性就很高。相比中介中心性,接近中心性更接近几何上的中心位置。示例如下:</strong></li></ul><p>假设我们要计算节点D的接近中心性,首先我们计算从节点D到所有其他节点的最短距离。从图中可以判断,节点D到所有其他节点的距离均为1,距离之和为6。因此,节点D的接近中心性为(7-1)/6=1。分子为网络中节点总数减去1。也就是说,如果一个人可以直接跟网络中所有其他人联系,那么他/她的接近中心性就是1。对于其他节点,如节点A的接近中心性为(7-1)/9=0.667。</p><ul><li>特征向量中心性(eigenvector centrality):一个节点的中心性是相邻节点中心性的函数。<strong>也就是说,与你连接的人越重要,你也就越重要。</strong></li></ul><p><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1708586527682-4c33bfe7-0fd5-4298-9fa2-d65f2003eff2.png#averageHue=%23f8f6f5&clientId=uea71e7c1-2f2b-4&from=paste&height=199&id=ucf542ca1&originHeight=398&originWidth=484&originalType=binary&ratio=1.25&rotation=0&showTitle=false&size=88938&status=done&style=none&taskId=ua3638677-4324-4185-a7aa-72607761c60&title=&width=242" alt="image.png"></p><h2 id="影响权重"><a href="#影响权重" class="headerlink" title="影响权重"></a>影响权重</h2><h2 id="kronecker内积"><a href="#kronecker内积" class="headerlink" title="kronecker内积"></a>kronecker内积</h2><p><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1709019483599-4705f16e-4b62-49a3-8312-10a9f418949e.png#averageHue=%23fafafa&clientId=ueaa63eb5-dd28-4&from=paste&height=119&id=uc59f6dff&originHeight=186&originWidth=865&originalType=binary&ratio=2&rotation=0&showTitle=false&size=22133&status=done&style=none&taskId=u700437cd-1daf-474e-a20f-1d2e4c33ef9&title=&width=554.5" alt="image.png"></p><h2 id="左随机矩阵"><a href="#左随机矩阵" class="headerlink" title="左随机矩阵"></a>左随机矩阵</h2><p>(left stochastic matrix)是实方阵,其中每一列求和为1。</p><ul><li><strong>右随机矩阵</strong>(right stochastic matrix)是实方阵,其中每一行求和为1。</li><li><strong>双随机矩阵</strong>(doubly stochastic matrix)是非负实数方阵,每个行和列求和均为1。</li></ul><h2 id="本原矩阵"><a href="#本原矩阵" class="headerlink" title="本原矩阵"></a>本原矩阵</h2><p>若一个n阶非负不可约矩阵(A的模=单特征值的个数)的单特征值个数为1,则称A为本原矩阵. </p><h2 id="openrank的数学理论"><a href="#openrank的数学理论" class="headerlink" title="openrank的数学理论"></a>openrank的数学理论</h2><p>为什么使用L1规范化而不是L2是因为BiRank要求图是无向二步图,邻接矩阵是分块的对称矩阵<br>降低马太效应在这里的结果是解决了传统PageRank中入度高的节点最后PageRank值较高<br>此处的迭代公式由α决定了初值的作用<br>这里的方法是一维的<br><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1709016084687-cb26d59c-c666-4afe-9f3f-95fb0ef8f1e3.png#averageHue=%23171e24&clientId=ueaa63eb5-dd28-4&from=paste&height=370&id=u13e629b1&originHeight=740&originWidth=1520&originalType=binary&ratio=2&rotation=0&showTitle=false&size=1136282&status=done&style=none&taskId=u886f4b31-8b25-4341-b686-4c497de6e02&title=&width=760" alt="image.png"><br><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1709016346651-e3f24521-bca8-4d61-80ed-8e744e521cf4.png#averageHue=%2311181e&clientId=ueaa63eb5-dd28-4&from=paste&height=273&id=ufd8e7748&originHeight=546&originWidth=1551&originalType=binary&ratio=2&rotation=0&showTitle=false&size=632088&status=done&style=none&taskId=u7ed25773-d7d7-4274-b896-56708abe88c&title=&width=775.5" alt="image.png"><br>下面是对OpenRank数学理论高纬度的推广<br>函数的映射值也是映射出一个d_i_的向量<br>图中表示节点中心度的方法是所有类型节点的维度的拼接,在自己有的维度上值会有大于0的值,那这样空间的使用会不会很浪费?<br><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1709018355179-cfe9d0df-fb39-475e-83c3-522402b573bb.png#averageHue=%23171e24&clientId=ueaa63eb5-dd28-4&from=paste&height=363&id=u56f741c2&originHeight=726&originWidth=1498&originalType=binary&ratio=2&rotation=0&showTitle=false&size=1083482&status=done&style=none&taskId=u7da202d8-48f1-4d4c-a9c6-ef3e66b2d41&title=&width=749" alt="image.png"><br>OpenRank工程实践的计算方法,当确定图可以收敛的时候可以直接采用第二种方法。<br><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1709021645763-d2e5e156-c359-438a-8fd7-bd477af75138.png#averageHue=%23384b5e&clientId=ueaa63eb5-dd28-4&from=paste&height=501&id=u6524ae60&originHeight=1002&originWidth=2102&originalType=binary&ratio=2&rotation=0&showTitle=false&size=1778366&status=done&style=none&taskId=ua21c9efe-fbf3-437c-8c82-4dad1d09ced&title=&width=1051" alt="image.png"><br>将开发者与项目连接从而降低迭代次数提升计算速度是一个经验性的结论,迭代次数的设置目前还没有什么明确的数学分析。<br>因为在实际的社区结构中,图密度其实很低,采用传统的PageRank算法的稠密图会使得计算量大幅增加<br><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1709021894077-646289f3-14a6-4524-a590-04b4e74b327f.png#averageHue=%23171e24&clientId=ueaa63eb5-dd28-4&from=paste&height=607&id=u7f032063&originHeight=1213&originWidth=2226&originalType=binary&ratio=2&rotation=0&showTitle=false&size=2297197&status=done&style=none&taskId=u796002e4-674c-412e-8a43-453108e9c1a&title=&width=1113" alt="image.png"><br>具体实践如下:<br><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1709024193461-8956ea14-857e-4813-b34f-69768e60f5fb.png#averageHue=%2311191e&clientId=ueaa63eb5-dd28-4&from=paste&height=378&id=u61f60488&originHeight=755&originWidth=1099&originalType=binary&ratio=2&rotation=0&showTitle=false&size=752798&status=done&style=none&taskId=ue8aeddf5-af0d-4e05-8d98-eebc5b3f849&title=&width=549.5" alt="image.png"><br>不同边权重如何确定,层次分析法的专家给出的权重可以有1-5和1-9两种维度<br><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1709024219311-716cb2d3-fcbe-403c-8393-a8bab145a0ef.png#averageHue=%23151b21&clientId=ueaa63eb5-dd28-4&from=paste&height=302&id=u66931b95&originHeight=604&originWidth=1194&originalType=binary&ratio=2&rotation=0&showTitle=false&size=733961&status=done&style=none&taskId=u3d705044-c62d-4a93-a5a1-66de58a906a&title=&width=597" alt="image.png"><br>示例:<br><img src="https://cdn.nlark.com/yuque/0/2024/png/39023202/1709024655892-cabcb115-d0bd-4a26-9354-c7dc69373558.png#averageHue=%23121a1f&clientId=ueaa63eb5-dd28-4&from=paste&height=370&id=u990e5f0e&originHeight=740&originWidth=1427&originalType=binary&ratio=2&rotation=0&showTitle=false&size=493968&status=done&style=none&taskId=uff8d1eb9-a6f7-4126-9902-69fe262b387&title=&width=713.5" alt="image.png"></p>]]></content>
<categories>
<category>study</category>
</categories>
<tags>
<tag>study</tag>
<tag>report</tag>
</tags>
</entry>
<entry>
<title>Hello World</title>
<link href="/2024/04/11/hello-world/"/>
<url>/2024/04/11/hello-world/</url>
<content type="html"><![CDATA[<p>Welcome to <a href="https://hexo.io/">Hexo</a>! This is your very first post. Check <a href="https://hexo.io/docs/">documentation</a> for more info. If you get any problems when using Hexo, you can find the answer in <a href="https://hexo.io/docs/troubleshooting.html">troubleshooting</a> or you can ask me on <a href="https://github.com/hexojs/hexo/issues">GitHub</a>.</p><h2 id="Quick-Start"><a href="#Quick-Start" class="headerlink" title="Quick Start"></a>Quick Start</h2><h3 id="Create-a-new-post"><a href="#Create-a-new-post" class="headerlink" title="Create a new post"></a>Create a new post</h3><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br></pre></td><td class="code"><pre><code class="hljs bash">$ hexo new <span class="hljs-string">"My New Post"</span><br></code></pre></td></tr></table></figure><p>More info: <a href="https://hexo.io/docs/writing.html">Writing</a></p><h3 id="Run-server"><a href="#Run-server" class="headerlink" title="Run server"></a>Run server</h3><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br></pre></td><td class="code"><pre><code class="hljs bash">$ hexo server<br></code></pre></td></tr></table></figure><p>More info: <a href="https://hexo.io/docs/server.html">Server</a></p><h3 id="Generate-static-files"><a href="#Generate-static-files" class="headerlink" title="Generate static files"></a>Generate static files</h3><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br></pre></td><td class="code"><pre><code class="hljs bash">$ hexo generate<br></code></pre></td></tr></table></figure><p>More info: <a href="https://hexo.io/docs/generating.html">Generating</a></p><h3 id="Deploy-to-remote-sites"><a href="#Deploy-to-remote-sites" class="headerlink" title="Deploy to remote sites"></a>Deploy to remote sites</h3><figure class="highlight bash"><table><tr><td class="gutter"><pre><span class="line">1</span><br></pre></td><td class="code"><pre><code class="hljs bash">$ hexo deploy<br></code></pre></td></tr></table></figure><p>More info: <a href="https://hexo.io/docs/one-command-deployment.html">Deployment</a></p>]]></content>
</entry>
</search>