终其一生,我们只不过在寻找自己

0%

在11月底面试通过(面试参考之前的准备Q音推荐实习面试的笔记),开始到腾讯音乐推荐组实习,到上周离职,总共历时2个月3周,排除过年放假的两周,工作9周,50天左右。对于我来说,这是第一次技术岗的实习,虽然大二的时候去YY也做过技术岗,不过那个时候就是写SQL,而且也写得不好😂,算不上技术岗。

阅读全文 »

本文回顾近几十年发展过程,展望一下未来20年的发展方向。雷军说,站在风口,猪都能飞。既然大家都是猪,就要找好风口。

国家发改委首次明确「新基建」范围,具体涵盖

  1. 5G 基建
  2. 工业互联网
  3. 人工智能
  4. 大数据中心
  5. 高速公路轨道交通
  6. 新能源汽车充电桩
  7. 特高压
阅读全文 »

平衡业务策略与模型之间的关系。策略能力有限,模型也“没有银弹”。

最近刚好在研究策略和多样性的关系,就帮DataFunTalk社区又整理了一篇稿子,策略本身很乏味,但是策略可以解决很多模型解决不了的问题。
为什么会这样呢?主要还是模型太笨了,由于模型不能完全动态的掌握用户的心理变化,兴趣变化,所以一般的推荐模型都是对于用户的基于历史的点击率CTR预估,可以简化为分类或者回归模型。可是实际上,远远没有这么简单。我觉得最接近”智能化的推荐“的算法就应该是强化学习,算法推出一个item就是一次尝试,用户的行为会及时让系统收到反馈,无论是”多样性“,”准确性“,”兴趣偏好“,”负反馈“,统统都会被融合到Agent的激励里。之后有空了希望进一步调研强化学习在推荐的瓶颈。
以下为分享内容。

阅读全文 »

5004完结撒花🌸🌸ヽ(°▽°)ノ🌸🌸.

Q1

阅读全文 »

  • Subword Models 解决OOV问题

OOV: out-of-vocabulary即单词不在词汇库里的情况
之前的模型都是基于单词层面的,但是对于一个新单词“asd”没有解决方案。一个朴素的想法就是“拆分”,把长单词拆成几个单词的组合。相对于中文来说,就是一个新的词组去按照每个字的意思去理解单词的意思。
下面是解决方案。

阅读全文 »

这一节主要讲cnn在nlp中的应用,然后讲了几篇paper的思路。站在现在看CNN其实对于nlp并没有爆发性的突破,但是CNN也算是提取局部特征的思路,可以学习2017年以前那些人的尝试过程,也蛮有意思吧。

阅读全文 »

这次作业感觉有点简单啊。🤧 最后一题凭感觉写的,不知道对不对,如果有问题请在留言板告诉我。
希望大家留言板支持一下博主,打公式真的好累。☹️ 给个例子让你们参考一下。

阅读全文 »

这一节主要在介绍数据集和task。对于模型没太深究。

  • 问答系统QA

一般的project组成部分,很容易理解,不解释了。

阅读全文 »

抽象,再抽象。 AutoML体验有感。

抽象这个词我真的是越来越喜欢了。小时候把看不懂的文字或者画叫抽象,虽然那些东西我现在依然不懂,但是现在对于抽象这两个字多少有点认识。本科的时候老师说“数学是自然科学的抽象”,我感触最深的就是线性代数,线性代数在之后的各个学科基本都有应用,大部分和维数有关的都可以用线性代数来表示。

阅读全文 »