评价指标对于我的 audio caption 任务一直是一个 bottleneck,机器自动给生成的 caption 打的分数总是难以反映其质量,在此回顾一下常用的 caption 任务的自动评测指标,包括近年来提出的一些还未广泛使用的新指标。 自然语言生成 (Natural Language ...
PyTorch 的 Dataloader (Multiple Process)
上一篇讲 Dataloader 的文章中分析了单进程的 Dataloader 工作的情况,本文分析多进程情况下 Dataloader 的工作流程。 上篇中的单进程 Dataloader,iter() 返回的 Iterable 实例是 _SingleProcessDataLoaderIter,这里 ...
保研经历总结
保研结束之后本想总结这一段经历的,但一直在忙实验室的事情,忘记总结了。正好前两天,实验室大三的学弟问我 CS 保研的事情,看到他忐忑、没底的心理仿佛就看到了当年的我。其实学弟好歹是科班出身,我跨专业保研,比学弟更加没有信心,但同系学长跨专业保研成功的经验和网上的保研经验帖给了我不少帮助,让我能够做针 ...
PyTorch 的 Dataloader (Single Process)
Dataloader 是 PyTorch 提供的根据需求载入数据的接口,但许多地方看文档会觉得不清不楚,阅读 PyTorch 源码,有助于我们了解框架背后具体做了什么,更灵活地写符合需求的代码。 第一次看学长的 PyTorch 训练 pipeline 时看到 dataloader 部分可以说是一 ...
PyTorch 中的 RNN: pack 与解 pack
PyTorch 中处理序列的输入输出时,由于一个 batch 中的序列长度不一样,需要对输入输出进行“打包”(pack)和“解包”(unpack)的操作,主要用到 pack_padded_sequence 和 pad_packed_sequence 这两个函数。 对于序列输入,处理起来的一个难 ...
ShadowSocks 全平台科学上网 Guidance
前言ShadowSocks 基本认识本文介绍用ShadowSocks这个工具进行科学上网的配置方法,不知道啥是科学上网或者为啥要科学上网的童鞋可以不用再看下去了,相信你也没这个需求。。。 至于为啥选择ShadowSocks呢?笔者表示当年用了很长时间的Lantern突然被封,其它VPN找了半天,免费 ...
Maximum Subarray 系列
Maximum Subarray 是非常经典的算法题,最开始学数据结构的时候就讲了从$O(N^3)$到$O(N^2)$再到$O(N)$的优化过程,在此基础上还有其它变种题目。实际上,这一系列题都可以用动态规划来解决。 Maximum SubarraySource LeetCode: (53) ...
Dices Sum
Source: LintCode: (20) Dices Sum Description Throw n dices, the sum of the dices’ faces is S. Given n, find the all possible value of S along with ...
EM 算法简介
老实说,EM算法这玩意曾经一直是我心里一个坑,学了至少三遍 (周志华西瓜书第一遍,李航《统计学习方法》第二遍,过了一年又回顾了一遍) 才有了比较清楚的思路。跟着各种教程一行行看很容易陷入推导长长的公式的泥沼,到头来知道中间有用Jensen不等式放缩,知道要优化一个下界函数,但具体谈起细节来又不是那么 ...
firstblog
TitleEnglish testing. 中文测试。 Standard HTML elementButton Baidu Codeimport torch.nn as nnpadded, lengths = nn.rnn.utils.pad_packed_sequence(packed) win ...