-
Notifications
You must be signed in to change notification settings - Fork 0
Expand file tree
/
Copy pathindex.html
More file actions
1798 lines (1187 loc) · 44 KB
/
index.html
File metadata and controls
1798 lines (1187 loc) · 44 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
872
873
874
875
876
877
878
879
880
881
882
883
884
885
886
887
888
889
890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
906
907
908
909
910
911
912
913
914
915
916
917
918
919
920
921
922
923
924
925
926
927
928
929
930
931
932
933
934
935
936
937
938
939
940
941
942
943
944
945
946
947
948
949
950
951
952
953
954
955
956
957
958
959
960
961
962
963
964
965
966
967
968
969
970
971
972
973
974
975
976
977
978
979
980
981
982
983
984
985
986
987
988
989
990
991
992
993
994
995
996
997
998
999
1000
<!DOCTYPE html>
<html lang="zh-CN">
<head hexo-theme='https://github.com/volantis-x/hexo-theme-volantis/tree/4.3.1'>
<meta charset="utf-8">
<!-- SEO相关 -->
<meta name="robots" content="index,follow">
<!-- 渲染优化 -->
<meta http-equiv='x-dns-prefetch-control' content='on' />
<link rel='dns-prefetch' href='https://cdn.jsdelivr.net'>
<link rel="preconnect" href="https://cdn.jsdelivr.net" crossorigin>
<meta name="renderer" content="webkit">
<meta name="force-rendering" content="webkit">
<meta http-equiv="X-UA-Compatible" content="IE=Edge,chrome=1">
<meta name="HandheldFriendly" content="True" >
<meta name="apple-mobile-web-app-capable" content="yes">
<meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1">
<link rel="preload" href="/css/first.css" as="style">
<!-- 页面元数据 -->
<title>lornd's blog</title>
<!-- feed -->
<!-- import meta -->
<!-- link -->
<!-- import link -->
<link rel="stylesheet" href="/css/first.css">
<link rel="stylesheet" href="/css/style.css" media="print" onload="this.media='all';this.onload=null">
<noscript><link rel="stylesheet" href="/css/style.css"></noscript>
<script id="loadcss"></script>
<script>
if (/*@cc_on!@*/false || (!!window.MSInputMethodContext && !!document.documentMode))
document.write(
'<style>'+
'html{'+
'overflow-x: hidden !important;'+
'overflow-y: hidden !important;'+
'}'+
'.kill-ie{'+
'text-align:center;'+
'height: 100%;'+
'margin-top: 15%;'+
'margin-bottom: 5500%;'+
'}'+
'</style>'+
'<div class="kill-ie">'+
'<h1><b>抱歉,您的浏览器无法访问本站</b></h1>'+
'<h3>微软已经于2016年终止了对 Internet Explorer (IE) 10 及更早版本的支持,<br/>'+
'继续使用存在极大的安全隐患,请使用当代主流的浏览器进行访问。</h3><br/>'+
'<a target="_blank" rel="noopener" href="https://www.microsoft.com/zh-cn/WindowsForBusiness/End-of-IE-support"><strong>了解详情 ></strong></a>'+
'</div>');
</script>
<noscript>
<style>
html{
overflow-x: hidden !important;
overflow-y: hidden !important;
}
.kill-noscript{
text-align:center;
height: 100%;
margin-top: 15%;
margin-bottom: 5500%;
}
</style>
<div class="kill-noscript">
<h1><b>抱歉,您的浏览器无法访问本站</b></h1>
<h3>本页面需要浏览器支持(启用)JavaScript</h3><br/>
<a target="_blank" rel="noopener" href="https://www.baidu.com/s?wd=启用JavaScript"><strong>了解详情 ></strong></a>
</div>
</noscript>
<!-- hexo injector head_end start -->
<link rel="stylesheet" href="https://cdn.jsdelivr.net/npm/katex@0.12.0/dist/katex.min.css">
<link rel="stylesheet" href="https://cdn.jsdelivr.net/npm/hexo-math@4.0.0/dist/style.css">
<!-- hexo injector head_end end --><link href="https://cdn.bootcss.com/KaTeX/0.11.1/katex.min.css" rel="stylesheet" /></head>
<body>
<header id="l_header" class="l_header auto shadow blur " style='opacity: 0' >
<div class='container'>
<div id='wrapper'>
<div class='nav-sub'>
<p class="title"></p>
<ul class='switcher nav-list-h m-phone' id="pjax-header-nav-list">
<li><a id="s-comment" class="fas fa-comments fa-fw" target="_self" href='javascript:void(0)'></a></li>
<li><a id="s-toc" class="s-toc fas fa-list fa-fw" target="_self" href='javascript:void(0)'></a></li>
</ul>
</div>
<div class="nav-main">
<a class="title flat-box" target="_self" href='/'>
<img no-lazy class='logo' src='https://cdn.jsdelivr.net/gh/volantis-x/cdn-org/blog/Logo-NavBar@3x.png'/>
</a>
<div class='menu navigation'>
<ul class='nav-list-h m-pc'>
<li>
<a class="menuitem flat-box faa-parent animated-hover" href=/
id="home"
>
<i class='fas fa-rss fa-fw'></i>博客
</a>
</li>
<li>
<a class="menuitem flat-box faa-parent animated-hover" href=/friends/
id="friends"
>
<i class='fas fa-link fa-fw'></i>友情链接
</a>
</li>
</ul>
</div>
<div class="m_search">
<form name="searchform" class="form u-search-form">
<i class="icon fas fa-search fa-fw"></i>
<input type="text" class="input u-search-input" placeholder="Search..." />
</form>
</div>
<ul class='switcher nav-list-h m-phone'>
<li><a class="s-search fas fa-search fa-fw" target="_self" href='javascript:void(0)'></a></li>
<li>
<a class="s-menu fas fa-bars fa-fw" target="_self" href='javascript:void(0)'></a>
<ul class="menu-phone list-v navigation white-box">
<li>
<a class="menuitem flat-box faa-parent animated-hover" href=/
id="home"
>
<i class='fas fa-rss fa-fw'></i>博客
</a>
</li>
<li>
<a class="menuitem flat-box faa-parent animated-hover" href=/friends/
id="friends"
>
<i class='fas fa-link fa-fw'></i>友情链接
</a>
</li>
</ul>
</li>
</ul>
</div>
</div>
</div>
</header>
<div id="l_body">
<div id="l_cover">
<div id="full" class='cover-wrapper dock' style="display: ;">
<div class='cover-bg lazyload placeholder' data-bg="https://cdn.jsdelivr.net/gh/volantis-x/cdn-wallpaper-minimalist/2020/042.jpg"></div>
<div class='cover-body'>
<div class='top'>
<p class="title">lornd's Blog</p>
<p class="subtitle">学算法时一定要想怎么去改进!</p>
</div>
<div class='bottom'>
<div class='menu navigation'>
<div class='list-h'>
</div>
</div>
</div>
</div>
<div id="scroll-down" style="display: ;"><i class="fa fa-chevron-down scroll-down-effects"></i></div>
</div>
</div>
<div id="safearea">
<div class="body-wrapper" id="pjax-container">
<div class='l_main'>
<section class="post-list">
<div class='post-wrapper'>
<div class="post post-v3 white-box reveal shadow">
<div class='pin'>
<img src='https://cdn.jsdelivr.net/gh/twitter/twemoji@13.0/assets/svg/1f4cc.svg'/>
</div>
<h2 class="article-title" pin>
<a href="/MLofAndrew.html">
吴恩达机器学习知识速查
</a>
</h2>
<div class='md'>
第一章 绪论
机器学习
Arthur Samuel 的定义:在不被明确定义的情况下,给予计算机学习的能力的研究领域。
Tom Mitchell 的定义:计算机从经验 EEE 中学习,解决某一任务 TTT ,进行性能度量 PPP 。通过 PPP 评测其在任务 TTT 上的表现,这个表现会因为 EEE 而提高。
常见的机器学习算法:监督学习、无监督学习。
监督学习
监督学习给予机器学习算法一个包...
</div>
<div class='meta-v3' line_style='solid'>
<div>
<time>2023-07-09</time>
</div>
<div>
<a class='readmore' href='/MLofAndrew.html'>
阅读全文
</a>
</div>
</div>
</div>
</div>
<div class='post-wrapper'>
<div class="post post-v3 white-box reveal shadow">
<h2 class="article-title" >
<a href="/null.html">
[论文解读]A Data-Driven Approach for Learning to Control Computers
</a>
</h2>
<div class='md'>
论文地址:A Data-Driven Approach for Learning to Control Computers 。
摘要
如果机器能够和人类一样使用计算机,进而在每天的任务上都帮助我们,这会是非常有用的。在这个场景下,还可以利用大规模的专家演示和人类对互动行为的判断,这是推动 AI 最近取得成功的两个因素。在本文中,我们研究基于自然语言描述的目标,利用鼠标和键盘操控电脑的场景。我...
</div>
<div class='meta-v3' line_style='solid'>
<div>
<time>2023-09-12</time>
</div>
<div>
<a class='readmore' href='/null.html'>
阅读全文
</a>
</div>
</div>
</div>
</div>
<div class='post-wrapper'>
<div class="post post-v3 white-box reveal shadow">
<h2 class="article-title" >
<a href="/flin.html">
[论文解读]FLIN: A Flexible Natural Language Interface for Web Navigation
</a>
</h2>
<div class='md'>
论文地址:FLIN: A Flexible Natural Language Interface for Web Navigation 。
摘要
AI 助手现在可以通过直接与网页 UI 交互为用户完成任务。但是如果没有持续的再训练,现有的语义解析技术和槽填充技术无法灵活地适应各种不同的网站。
我们提出了 FLIN,一个用于网页导航的自然语言接口,可以将用户命令映射为概念层次的动作(而不是低层...
</div>
<div class='meta-v3' line_style='solid'>
<div>
<time>2023-09-09</time>
</div>
<div>
<a class='readmore' href='/flin.html'>
阅读全文
</a>
</div>
</div>
</div>
</div>
<div class='post-wrapper'>
<div class="post post-v3 white-box reveal shadow">
<h2 class="article-title" >
<a href="/aeg.html">
[论文解读]Adversarial Environment Generation for Learning to Navigate the Web
</a>
</h2>
<div class='md'>
论文地址:Adversarial Environment Generation for Learning to Navigate the Web 。
摘要
学习如何自动在网页中进行导航是一个困难的序列决策工作。状态空间和动作空间巨大,且具有组合特性,同时网站也是包含多个页面的动态环境。训练网页导航智能体的一个瓶颈是为训练环境提供一个可学习的课程,并且要求能够覆盖真实世界网站的多样性。因此,我...
</div>
<div class='meta-v3' line_style='solid'>
<div>
<time>2023-08-20</time>
</div>
<div>
<a class='readmore' href='/aeg.html'>
阅读全文
</a>
</div>
</div>
</div>
</div>
<div class='post-wrapper'>
<div class="post post-v3 white-box reveal shadow">
<h2 class="article-title" >
<a href="/qweb.html">
[论文解读]learning to navigate the web
</a>
</h2>
<div class='md'>
论文地址:learning to navigate the web 。
摘要
在有着巨大的状态空间和动作空间,以及稀疏奖励的环境中进行学习,会阻碍强化学习智能体通过试错的学习过程。例如,在网页上遵循自然语言命令执行操作(如预定机票),会创造一个输入词汇量和单个页面上可操作元素数量非常庞大的强化学习环境。即使最近的研究通过人类演示引导探索,在相对简单的环境中提升了成功率,在那些可能有成千上万条...
</div>
<div class='meta-v3' line_style='solid'>
<div>
<time>2023-08-16</time>
</div>
<div>
<a class='readmore' href='/qweb.html'>
阅读全文
</a>
</div>
</div>
</div>
</div>
<div class='post-wrapper'>
<div class="post post-v3 white-box reveal shadow">
<h2 class="article-title" >
<a href="/nl2we.html">
[论文解读]Mapping natural language commands to web elements
</a>
</h2>
<div class='md'>
论文地址:Mapping natural language commands to web elements 。
摘要
Web 提供了一个丰富的开放域环境,具有文本、结构和空间属性。在这个环境中,我们提出了一个需要将语言与环境联系起来的任务(task for grounding language):给定一个自然语言命令(如“点击第二篇文章”),在 web 页面上选择正确的元素(如一个超链接或...
</div>
<div class='meta-v3' line_style='solid'>
<div>
<time>2023-08-09</time>
</div>
<div>
<a class='readmore' href='/nl2we.html'>
阅读全文
</a>
</div>
</div>
</div>
</div>
<div class='post-wrapper'>
<div class="post post-v3 white-box reveal shadow">
<h2 class="article-title" >
<a href="/NL2API.html">
[论文解读]Building Natural Language Interfaces to Web APIs
</a>
</h2>
<div class='md'>
论文地址:Building Natural Language Interfaces to Web APIs 。
摘要
随着 Web 面向服务架构的发展,应用程序接口(application program interfaces,APIs)正在变成提供对数据、服务和设备的访问越来越重要的方法。我们研究自然语言转换成 API (NL2APIs)问题,并且关注 Web 服务的 Web API。这些...
</div>
<div class='meta-v3' line_style='solid'>
<div>
<time>2023-08-05</time>
</div>
<div>
<a class='readmore' href='/NL2API.html'>
阅读全文
</a>
</div>
</div>
</div>
</div>
<div class='post-wrapper'>
<div class="post post-v3 white-box reveal shadow">
<h2 class="article-title" >
<a href="/wge.html">
[论文解读]Reinforcement Learning on Web Interfaces using Workflow-Guided Exploration
</a>
</h2>
<div class='md'>
论文地址:Reinforcement Learning on Web Interfaces using Workflow-Guided Exploration 。
摘要
强化学习的智能体通过试错来学习,但是当奖励十分稀疏,智能体不能发现成功的动作序列时,学习就会停滞不前。这在训练深度强化学习智能体完成基于 Web 的任务时是一个难以忽视的问题,如订机票,回复邮件等任务。在这些任务中,通常一个...
</div>
<div class='meta-v3' line_style='solid'>
<div>
<time>2023-06-28</time>
</div>
<div>
<a class='readmore' href='/wge.html'>
阅读全文
</a>
</div>
</div>
</div>
</div>
<div class='post-wrapper'>
<div class="post post-v3 white-box reveal shadow">
<h2 class="article-title" >
<a href="/wob.html">
[论文解读]World of Bits: An Open-Domain Platform for Web-Based Agents
</a>
</h2>
<div class='md'>
论文地址:World of Bits: An Open-Domain Platform for Web-Based Agents
摘要
虽然模拟游戏环境极大地加速了强化学习方面的研究,现有的环境在计算机视觉以及自然语言处理的任务上缺乏开放域的真实感。这些任务在自然、有机的环境下,对人造的物体进行操作。为了促进这些环境中强化学习的研究,我们提出了比特世界(World of Bits, WoB)...
</div>
<div class='meta-v3' line_style='solid'>
<div>
<time>2023-06-19</time>
</div>
<div>
<a class='readmore' href='/wob.html'>
阅读全文
</a>
</div>
</div>
</div>
</div>
<div class='post-wrapper'>
<div class="post post-v3 white-box reveal shadow">
<h2 class="article-title" >
<a href="/rrsnavigation.html">
强化学习推荐系统论文导航
</a>
</h2>
<div class='md'>
DRN: A Deep Reinforcement Learning Framework for News Recommendation
目标:最大化用户满意度,包括点击标签和用户活跃度。
状态:新闻特征、用户特征、用户新闻特征、上下文特征。
动作:新闻推荐列表。
奖励:用户是否点击推荐的新闻,以及用户活跃度。
基于 Double DQN 和 Dueling DQN 。
探索过程:对原始网络...
</div>
<div class='meta-v3' line_style='solid'>
<div>
<time>2023-02-26</time>
</div>
<div>
<a class='readmore' href='/rrsnavigation.html'>
阅读全文
</a>
</div>
</div>
</div>
</div>
</section>
<br>
<div class="prev-next">
<p class="current">
1 / 2
</p>
<a class="next" rel="next" href="/page/2/">
<section class="post next white-box shadow">
下一页 <i class="fas fa-chevron-right" aria-hidden="true"></i>
</section>
</a>
</div>
</div>
<aside class='l_side'>
<section class="widget blogger shadow desktop mobile">
<div class='content'>
<a class='avatar flat-box rectangle' href='/about/'>
<img no-lazy src='\images\avatar.jpg'/>
</a>
<div class='text'>
<p><span id="jinrishici-sentence">lornd's blog</span></p>
<script src="https://sdk.jinrishici.com/v2/browser/jinrishici.js" charset="utf-8"></script>
</div>
<div class="social-wrapper">
<a href="/atom.xml"
class="social fas fa-rss flat-btn"
target="_blank"
rel="external nofollow noopener noreferrer">
</a>
<a href="mailto:me@xxx.com"
class="social fas fa-envelope flat-btn"
target="_blank"
rel="external nofollow noopener noreferrer">
</a>
<a href="https://github.com/volantis-x/"
class="social fab fa-github flat-btn"
target="_blank"
rel="external nofollow noopener noreferrer">
</a>
<a href="/"
class="social fas fa-headphones-alt flat-btn"
target="_blank"
rel="external nofollow noopener noreferrer">
</a>
</div>
</div>
</section>
</aside>
<!--此文件用来存放一些不方便取值的变量-->
<!--思路大概是将值藏到重加载的区域内-->
<script>
window.pdata={}
pdata.ispage=false;
pdata.postTitle="";
pdata.commentPath="";
pdata.commentPlaceholder="";
// header 这里无论是否开启pjax都需要
var l_header=document.getElementById("l_header");
l_header.classList.remove("show");
// cover
var cover_wrapper=document.querySelector('.cover-wrapper');
cover_wrapper.id="full";
cover_wrapper.style.display="";
</script>
</div>
<footer class="footer clearfix">
<br><br>
<div class="aplayer-container">
</div>
<br>
<div class="social-wrapper">
</div>
<div><p>博客内容遵循 <a target="_blank" rel="noopener" href="https://creativecommons.org/licenses/by-nc-sa/4.0/deed.zh">署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0) 协议</a></p>
</div>
<div><p><span id="lc-sv">本站总访问量为 <span id='number'><i class="fas fa-circle-notch fa-spin fa-fw" aria-hidden="true"></i></span> 次</span> <span id="lc-uv">访客数为 <span id='number'><i class="fas fa-circle-notch fa-spin fa-fw" aria-hidden="true"></i></span> 人</span></p>
</div>
本站使用
<a href="https://github.com/volantis-x/hexo-theme-volantis/tree/4.3.1" target="_blank" class="codename">Volantis</a>
作为主题
<div class='copyright'>
<p><a href="/">Copyright © 2017-2020 XXX</a></p>
</div>
</footer>
<a id="s-top" class="fas fa-arrow-up fa-fw" href="javascript:void(0)"></a>
</div>
</div>
<div>
<script>
/************这个文件存放不需要重载的全局变量和全局函数*********/
window.volantis={};
window.volantis.loadcss=document.getElementById("loadcss");
/******************** Pjax ********************************/
function VPjax(){
this.list=[] // 存放回调函数
this.start=()=>{
for(var i=0;i<this.list.length;i++){
this.list[i].run();
}
}
this.push=(fn,name)=>{
var f=new PjaxItem(fn,name);
this.list.push(f);
}
// 构造一个可以run的对象
function PjaxItem(fn,name){
// 函数名称
this.name = name || fn.name
// run方法
this.run=()=>{
fn()
}
}