-
Year-End Summary 2025 (Part II) En/中文
Second part of 2025 year-end summary
Loading stats... -
Year-End Summary 2025 (Part I) En/中文
First part of 2025 year-end summary
Loading stats... -
2024年年终总结
一转眼2024年又接近尾声了,该是写总结的时候了。 学术研究这一年我们还是做了一些比较有趣的工作,主要围绕两个要点:其一是提高大语言模型(LLM)在一些困难推理和规划(reasoning & plan...
Loading stats... -
求道之人,不问寒暑(十)
好久没写这个系列了,一方面是因为我最近实在比较忙,另一方面也是想要等一等,分享自己觉得挺重要的结果。这次正好在去COLM的飞机上有点空,写一点。 从第一篇 田渊栋:求道之人,不问寒暑 开始,这个系列已...
Loading stats... -
小说出版了
科幻小说《破晓之钟》终于出版了!感谢博文视点总编辑 @张春雨 和 @电子工业出版社 的支持,内容与先前网上版本相比有不少改动。应出版社要求,为了不影响销量就先把网上的全文链接去掉了。大家有兴趣可以扫以...
Loading stats... -
2023年终总结
又到了一年的尾声了。今年是狂飙突进的一年,无论在技术上,还是在技术之外的领域上。 今年都没有空写分享文章,光看文章追热点就看不过来了,希望明年能够好些(当然也可能竞争变得更加激烈)。 今年研究的主要重...
Loading stats... -
关于GPT-4的一点狂想(其二)
个人能力变得更加重要大模型必然有一天会在个人电脑或是手机上运行,并且成为每个人高度定制的工具。在每个人可以与自己的工具高效交流,甚至工具之间都可以自动交流之后(比如我的AI和你的AI开个会讨论一下,并...
Loading stats... -
关于GPT-4的一点感想(后一篇)
上一篇文章获得了一些有趣的反响,再写一篇以飨读者。 我们为什么而学习?一直以来,人们学习主要是为了获得学历,以便找到好工作,然后赚钱养家退休,看着下一代继续成长。但在大模型的能力超越普通人的时代,学习...
Loading stats... -
关于GPT-4的一些感想
OpenAI昨天发布了GPT-4,试用了一下确实很不错。 在我主要关心的故事生成方面,与ChatGPT生成出来的故事相比,GPT-4文笔更佳细节更多,更擅长生动具体的描绘,情节也开始出现一些有趣的转折...
Loading stats... -
基于大语言模型的故事生成器
讲完了理论,我们来讲一下我们最近发表的实用文章。 以下这篇文章最近中了EMNLP'22,链接见 这里 ,代码见这里 。 [图片] 我自己业余也写写小说,有一个自动故事生成器是长久以来的梦想,这次借着大...
Loading stats... -
求道之人,不问寒暑(九)
年底要到了,又是总结的时间。接下来会发一些专栏文章。 之前推广的工作之一 alpha-CL ,这次中了NeurIPS Oral,非常高兴。这是第一次单一作者文章中Oral,感谢评委们的肯定,也证明在完...
Loading stats... -
求道之人,不问寒暑(八)
从2015年开始,《求道之人不问寒暑》这个系列已经写了很多年了,主要聚焦点在深度学习的理论分析上。理论研究虽然很难下手,挫折甚多,但从未停止,一直坚持到了今天,在可见的将来,还会继续坚持下去。 一直以...
Loading stats... -
ICLR2022文章速览(三)
最后一篇ICLR在周四讲。 NASViT: Neural Architecture Search for Efficient Vision Transformers with Gradient Con...
Loading stats... -
ICLR2022文章速览(二)
Multi-objective Optimization by Learning Space Partition (文章链接Multi-objective Optimization by Learni...
Loading stats... -
ICLR2022文章速览(一)
本次ICLR2022我们共中稿三篇文章,其中两篇会在周二宣讲,一篇在周四宣讲。欢迎大家过来询问。 Understanding Dimensional Collapse in Contrastive S...
Loading stats... -
技术之外(六)关于开会
开会是个每个人都要做的事情,每天都要开会,和不同的人开会。开会有一些重要的环节要注意的。 第一件重要的事情,是开会不要迟到。在公司里开会,几乎没人迟到,最多迟到一两分钟,如果在一个小型会议里迟到了五分...
Loading stats... -
技术之外(五)克服惰性(外一篇)
“克服惰性”是另一个大家关注的话题。 说起这个话题,大家总是会想到历史上的各种传奇人物如何如何坚韧不拔,克服重重困难,达成不朽的功绩。但我想说的是,虽然必要的自控力是重要的,但还是不要太过相信自己的毅...
Loading stats... -
技术之外(四)深度阅读(外一篇)
大家对如何进行深度阅读很有兴趣,这里就更深入地讲一下。 一般性阅读与深度阅读的区别,关键是,脑中是否对文中观点进行了深加工。 前者要求低很多,只要记得大致观点就可以,不需要对观点做深加工。比如说文章里...
Loading stats... -
技术之外(三)深度阅读与思考
我们公司有很多各类的辅导计划(mentorship program),我经常作为辅导员(mentor)给别人提建议。 有一次我匹配到一个印度女生,她刚换到一个新的组里,对项目不是很熟悉,对自己的前途也...
Loading stats... -
技术之外(二)关于合作
摆脱盲目内卷的心态,拥抱合作 我们以往的教育,往往鼓励的是通过内卷把别人踩在脚底下,强调如何在竞争中成为获胜者享有荣誉,但对如何合作双赢却很少着墨。其实后者是很多成功背后的根本原因,如前一篇所说,成就...
Loading stats... -
技术之外(一)
最近太忙,很久没在知乎上写专栏了,这次乘着ICML结束后稍微写一点。 从小到大,中国家长都训练孩子考高分,啥事不用管,只要闷头做题就好了。现在还有“做题家”的称呼。虽然“一个人把活干了”值得惊叹,也能...
Loading stats... -
2021年年终总结
这一年在组里开了一个比较大的方向,组织并带领团队一点点往前走,并且获得了一些初步的成果。文章方面,中了十篇paper(三篇ICML,四篇NeurIPS,一篇 AAAI ,一篇SIGCOMM ,还有一篇...
Loading stats... -
一些应对批评的经验
[图片] 今天兴致比较高,就多写一点。明天开始开ICML就没有时间了。 这一篇简要讲一下怎么在科研时积极应对别人的指责。 批评的价值 的主要观点是听了批评,要仔细审视,认真记下,也许会在将来有用,成为...
Loading stats... -
论文写作的意义
前一篇 批评的价值 写完之后,收到很多的评论。非常感谢大家的热情。之后乘热会写一些后续。这里先写第一篇阐释一下论文写作的意义。写作其实很重要,在很早以前的 博士五年总结 ,和博士五年之后五年的总结 里...
Loading stats... -
AlphaFold2极简总结
简单看了一下AlphaFold2的Nature文章研究了一下设计思路,初步总结如下: 训练神经网络来对regression target进行逐步迭代精化(Iterative refinement)确实...
Loading stats... -
批评的价值
我记得博士阶段收到过的一次特别负面的评价,来自于一个做客座演讲的访问教授,在听完了我对自己工作的自豪讲解之后,皱起眉头鄙夷地说了一句“你的工作一文不值,你的导师是谁?”,然后也不管我的辩解,扬长而去。...
Loading stats... -
关于高考的杂思
又是一年高考时。 回想起来,离自己当年高考已是过去整整二十年了。作为一个机器学习和人工智能的研究员,每天沉浸其中,自然会对三观产生潜移默化的影响。用这几年机器学习的进展,反过来看看教育的过程和人生的前...
Loading stats... -
退一步海阔天空
我还记得很早以前投稿的第一篇论文(2006年),是打鸡血通宵搞出来的,做完论文后坐在北京回上海的火车上过了一晚,随着火车的摇动,有一种非常惬意舒适的满足感(当时还没有高铁)。 之后在CMU读博的时候,...
Loading stats... -
求道之人,不问寒暑(七)
好了,乘着今年NeurIPS的截稿日推迟了48小时的机会,抽空介绍一下今年ICML中稿的文章。 这次有幸中了三篇Long talk(每篇long talk约3%的中稿率),算是运气爆棚,感谢给力的合作...
Loading stats... -
把棋盘翻过来想(外一篇)
在指导研究的时候,越来越感觉到正确方向的重要性。充分调研,缜密思考,仔细分析,有必要时自己推个公式再做点小实验验证一下,有切实的把握之后,再交给大家去做。所谓战必胜,攻必克,赢不了的仗一开始就不要去打...
Loading stats... -
把棋盘翻过来想
首先非常感谢知乎给我发了100股的美国存托证券,感谢知乎平台对于创作者的鼓励! 最近看到我2017年写的这个答案又被挺多人点赞了。现在回头再看这个答案还有各种回答和评论,又有一些感慨。 为什么有些学数...
Loading stats... -
《破晓之钟》后记
《破晓之钟》完稿了。全文在 破晓之钟 ,Epub连接见https://yuandong-tian.com/novel_daybreak_bell.epub 一直以来,写小说是我在科研正职以外的业余爱好...
Loading stats... -
2020年年末总结
众所周知,2020年是个非常不寻常的年份。这一年大部分时间都关在家里,哪儿都去不了,现在疫情又肆虐了,希望明年暑假之前可以回复正常办公吧。 然而另一方面,效率大为提高,可算是因祸得福。这一年的研究工作...
Loading stats... -
BeBold:一种新的强化学习探索准则
这次我们介绍一下今年的另一个比较有趣的工作。这个工作是Facebook AI Research和UC Berkeley合作,由BAIR Open Research Commons支持( Announc...
Loading stats... -
多智能体强化学习新工作
这次介绍一下我们在多智能体强化学习上的一篇新的工作:Collaborative Q-learning (CollaQ)。这个工作是Facebook AI Research和UC Berkeley合作的...
Loading stats... -
求道之人,不问寒暑(六,外一篇)
《求道之人》这个系列历时多年,也引来很多关注。 做理论,特别是做多层神经网络的理论分析,勇气可嘉,但之前也一直被人质疑:“这些理论分析有什么用?” 对于学生-教师这个理论框架,主要麻烦的地方在于,在有...
Loading stats... -
求道之人,不问寒暑(六)
好了,ICLR终于结束,而我也有时间再写点东西。 这次介绍一下我们学生-教师网络理论分析的最新进展,这次的工作把它用到了目前比较火的自监督学习(self-supervised learning,缩写为...
Loading stats... -
NeurIPS后感想
这次投稿了三篇主打文章(一作或者最后一作),中了两篇,还算不错。 这篇一作文章的理论在deadline前四天才被发现,在理论被发现之前,对策略变化的得分计算一直用的是一个极其复杂的方案,考虑各种状态进...
Loading stats... -
介绍两篇NeurIPS的文章(二)
本次中稿的第二篇文章是Learning Search Space Partition for Black-box Optimization using Monte Carlo Tree Search ...
Loading stats... -
介绍两篇NeurIPS的文章(一)
今天NeurIPS 2020放榜,我这里中了两篇主打文章,乘着周五大家还关注NeurIPS的情况,且我们内部ICLR的deadline已过,写两篇小博客各自介绍一下。 Joint Policy Sea...
Loading stats... -
一些随想(二)
开会是一个非常重要的过程。工作的时候不仅需要有成片不被打断的时间,还需要有主动被打断的时间,一方面让大脑适当休息,另一方向可以和别人交流想法。有时候几分钟的交流,其效率超过闷头干一天的活。其原因一是能...
Loading stats... -
一些随想
同样做学术研究,在工业界和学术界还是有点不一样的。 因为毕业和工作的压力,学术界博士生的积极性很强,而老板会决定他们是否能毕业,能否找到好工作,老板的一封推荐信有时候会定学生的生死。但工业界不一样,大...
Loading stats... -
求道之人,不问寒暑(五)
一晃眼,2020年已经过去半年。距离NeurIPS投完稿也快结束一个月了。这次NeurIPS的投稿有好几篇挺不错的,之后有空会分别介绍。 今年是个神奇的年份,事件太多,多到没空盘点。一月初我们还在夏威...
Loading stats... -
一个简单的十年回顾及展望
2020年终于来了,这是一个充满了科幻气息的数字,我现在每次和别人说”现在是2020年了“都会有一种奇妙的不真实感,仿佛各种科幻故事都要成为现实一样。 今年各种社交媒体上的一大趋势是开始了十年回顾,而...
Loading stats... -
关于AlphaStar
DeepMind的AlphaStar中了Nature,以下是看完之后的一些想法: 1. 人类大量的对局数据还是很重要的。这个首先体现在预训练上,预训练完的agent已经能排到前16%的人类玩家的水平了...
Loading stats... -
求道之人,不问寒暑(四)
在之前的LuckMatter文章之后,这次ICLR又写了一篇后续的工作,取消及削弱了一些假设,并获得了更强的结果。Arxiv请见: https://arxiv.org/abs/1909.13458 这...
Loading stats... -
求道之人,不问寒暑(三/外一篇)
这篇文章可以说是我自己五年来做“多层神经网络的理论分析”这个方向的一个初步令人满意的结果。我还记得那个BatchNorm的bias为负的实验还有BatchNorm的分析都是四年前做的,当我意识到新的假...
Loading stats... -
求道之人,不问寒暑(三)
昨天的arXiv预览大家看不到,所以我把blog撤回了。今天文章正式上线。 https://arxiv.org/abs/1905.13405 === 神经网络有很多异于传统机器学习系统(比如决策树和S...
Loading stats... -
博士五年之后五年的总结(终篇)
【家庭】 这五年以来,我觉得最幸运的是找对了我的另一半。老婆帮了太多的忙了,很多事情她处理得更好。她因为多年下棋的关系,计划能力非常之强,有计划就可以少浪费非常多非常多的时间,增加总体工作的效率。我是...
Loading stats... -
博士五年之后五年的总结(其三)
从小到大,常听长辈们说:“好好读书,好好学习,长大了才有好工作。”,似乎只要努力十几年,接下来就如童话般有一个美好的结局。但等我们真的到了而立之年,真的去找了一份工作,才发现人生才刚刚开始,接下来要怎...
Loading stats... -
博士五年之后五年的总结(其二)
这五年来,交流上的改进是另一个非常重要的环节。 之前的《博士五年总结》介绍了博士阶段应有的交流能力,做演讲,和同行交流,论文要写得流畅,等等。这些是作为一个科研工作者的应有水准。然而要是只做到这一点,...
Loading stats... -
博士五年之后五年的总结(其一)
现在回头想来,其实博士阶段是很单纯的。拿着微薄的薪水,带着毕业的压力,待在一个交通闭塞的地方,在导师的指导、鼓励或是逼迫下,在周围各种牛人的压力下,花一些时间,专心地做一些东西。在这些条件下,很多人可...
Loading stats... -
求道之人,不问寒暑(二)
这次ICLR投了一些文章出去,其中有一篇是我自己关于多层深度非线性局域神经网络(deep and locally connected nonlinear network)的理论工作,这里介绍一下。注意...
Loading stats... -
博士五年之后五年的总结(前言)
光阴如梭,时光荏苒。博士之后又是五年,离上次的《 博士五年总结 》也已经有五年时间了。在繁忙的工作中,我觉得有必要再写些东西,一是分享给大家自己新的经验,二是借此机会总结思考自己五年来的成败得失,以后...
Loading stats... -
世界人工智能大赛总结
本次比赛ELF OpenGo一直是用的V100单卡,没有增加任何计算资源。神经网络模型稍有改进,不过仍然是224x20blocks的版本。这次我们能进四强,并且在半决赛时和星阵打成2-3已经是出乎意料...
Loading stats... -
关于《棋魂》
油管上的歌,转着转着又到了《棋魂》系列。我很早以前就看过这部动画,可以说是第一部让人流泪的动画。《棋魂》里,有人天份奇高又有助力于是终成正果,有人鞠躬尽瘁却与胜利失之交臂,有人在放弃后终于又鼓起勇气继...
Loading stats... -
获第五届知乎【盐Club】荣誉会员感言
[图片] 我这次非常荣幸获得知乎盐Club荣誉会员称号,不过因为工作繁忙,再加上赶几篇NIPS,没有到现场领奖,没能和大家当面互动,比较遗憾。 人工智能最近大热,从一个原来的冷门专业一跃成为大众话题。...
Loading stats... -
关于ELF OpenGo一些问题的回复
最近网上很多讨论我们刚发布的ELF OpenGo的热帖,没有时间一一回复了。我把一些问题统一起来在这里回复一下。 首先非常感谢LeelaZero团队以最快的速度把我们的权重转成了LeelaZero可以...
Loading stats... -
一些感想
写完了官方报告现在写一点自己的感想。 这个项目不是为了做最好的围棋程序,不是说要打败谁。我们做这个是因为以下三个目的: (1) AlphaGoZero/AlphaZero算法很有意思,我们想知道为什么...
Loading stats... -
开源ELF OpenGo
我们最近改进了ELF框架,并且在上面实现了DeepMind的AlphaGoZero及AlphaZero的算法。用两千块GPU训练约两到三周后得到的围棋AI,基本上超过了强职业的水平。我们和韩国棋院合作...
Loading stats... -
2017年度总结
今年的主要研究方向是两个:一是强化学习及其在游戏上的应用,二是深度学习理论分析的探索。 今年理论方向我们做了一些文章,主要内容是分析浅层网络梯度下降非凸优化的收敛性质。首先是上半年我自己ICML的 这...
Loading stats... -
第一届FLAIR感想
[图片] 作为这次东方科技论坛,人工智能海外博士生研讨会(Future Leaders of AI Retreat, FLAIR)的组织者之一(感谢上海纽约大学张峥教授牵头),我觉得这次会议举办得很成...
Loading stats... -
关于AlphaZero的极短评论
同样的框架,国象4小时,将棋2小时。 https://arxiv.org/pdf/1712.01815.pdf 这让我觉得并非是围棋特别适合CNN,而是人类用CNN作为inductive bias,所...
Loading stats... -
关于AI的一些杂谈
(《文汇报 科技文摘》约稿,原文链接: 文汇报-人与机器必将走向合作融合 )关于AlphaGoAlphaGo厉害的地方在于结合了工程和科研两方面的工作,通过大量计算资源和工程优化将一个方向推向了极致,...
Loading stats... -
关于面试
面试研究员这样的职位,是不是文章越多越好呢?并不是这样的。 评估研究员,一个重要的方面是他/她有没有长期连续的工作。一开始的结果可能不太好,或者不知道究竟要做什么,但之后方向渐渐明朗,结果也越来越好,...
Loading stats... -
向明中学115周年征文
(本文应向明中学之邀而写,发表于《新民晚报》) 一直觉得,我在向明中学的两任历史老师都很不错,没有照本宣科,而是讲生动的故事教大家理解,让我一直以来都保留着对历史的兴趣。很多东西,用历史和进化的观点看...
Loading stats... -
关于AlphaGo Zero
老实说这篇Nature要比上一篇好很多,方法非常干净标准,结果非常好,以后肯定是经典文章了。 Policy network和value network放在一起共享参数不是什么新鲜事了,基本上现在的强化...
Loading stats... -
一些关于人工智能的讨论(二)
对AI来说,数据和经验是其最终的发展瓶颈。有数据的地方AI才能有过人的水准。无人车是个典型的例子,一开始数据很多进展很快,但随着系统的改进,从每公里出现一次问题到每一百公里出现一次问题,有价值的数据越...
Loading stats... -
VGML流水帐
这次有幸成为了首届VGML(Video Games and Machine Learning)的workshop的受邀演讲嘉宾。以下是流水帐。 [图片] 我第一个演讲,因为Gabriel的开场白只花了...
Loading stats... -
一些关于人工智能的讨论(一)
问:强AI是否会统治世界?奇点是否会到来? 首先“强AI”这个概念不是那么清晰。强AI或者弱AI,并非是由一个天才的点子造成的从0到1的突变,而是通过一系列的技术突破达成的循序渐近的渐变过程。拿计算机...
Loading stats... -
黑暗森林中的光之精灵
昨天晚上折腾到北京时间凌晨1点,终于完成了ELF开源的任务。这次开源获得了公司的支持,和代码一起公布的还有arXiv文章及公司的官方博客。国内的媒体真是快,我还没来得及写专栏,第二天早晨就看到机器之心...
Loading stats... -
7月4日,Yann的上海交通大学讲座
7月4日我们组的Director,著名的卷积神经网络(CNN)发明人,Facebook人工智能研究院院长,美国工程院院士Yann LeCun将访问上海交通大学,计划在菁菁堂演讲,并和大家座谈讨论人工智...
Loading stats... -
一些感悟
首先要自律。这是最基本的。如果一个人不能控制自己的行为,那无法走出自己的路。像说到要做到,有规律地锻炼身体,勤奋努力,这些都是重要的。 接下来要跳出舒适区。举个例子,勤奋本来就是舒适区的一种。“勤能补...
Loading stats... -
《深度学习和游戏中的推理》演讲概要
最近回国做了两次有关深度学习和游戏推理的演讲,主要介绍了一下各类游戏AI(国象,围棋,扑克)所用的技术,及我和实习生们目前在这方面所做的工作(计算机围棋开源程序DarkForest,和用于第一人称射击...
Loading stats... -
一些RL的文献(及笔记)
Introductions Introduction to reinforcement learning Index of /rowan/files/rl ICML Tutorials: http:/...
Loading stats... -
关于德州扑克
最近听说我的母校卡耐基梅隆大学德州扑克的AI Libratus以很大的优势赢得了与职业玩家的比赛,非常兴奋。在同时期,还有一篇来自加拿大阿尔伯塔大学(Univ of Alberta)的文章介绍了 De...
Loading stats... -
2016年总结
2016年是波澜壮阔的一年。 这一年人工智能领域最抢眼的莫过于AlphaGo与李世石的五番棋对决。这一战,极大地扭转了大众对人工智能的认知,注定会载入史册。 我有幸参与了历史。先是开了DarkFore...
Loading stats... -
答读者问
最近收到一些信问“自己是不是适合搞AI,门槛是不是太高”等等问题,也看到“IT是不是泡沫”等等讨论,我就写篇博客给大家分享下我的观点,顺便也分析一下做AI,ML及CS的前景。 其实AI现在算是野蛮生长...
Loading stats... -
求道之人,不问寒暑
我还记得那个决定不给NIPS投稿的傍晚。那时在车里,一个人待着,也不哭,也不笑,看着夕阳西下。七点多了,但因为是六月的关系,天还是亮着。周五傍晚,同事们都走完了,谷歌的校园里很安静,树叶在地上铺开,红...
Loading stats... -
ICLR总结
ICLR2017的投稿时间终于截止。这次投了三篇文章出去,是我个人做研究以来单次会议投稿数最多的一次。 1. 如何用增强学习中的Actor-Critic模型再加上课程学习来训练Doom AI拿到AI比...
Loading stats... -
长长的旅程
虽然深度学习人人都在喊人人都在用,但是它究竟为什么能有效果,到目前为止都没有初步的结论。具体来说,有两个理论问题没有解决,一个是泛化能力,另一个是收敛性。深度神经网络那么多参数,再配以能拟合世界上大部...
Loading stats... -
《机器之心》的采访
应《机器之心》邀请,在半年前所作的采访。 --- 卡耐基梅隆大学机器人系博士、前谷歌无人驾驶汽车项目组研究员、现 Facebook 人工智能组研究员,多重身份的加持和前沿、专业的研究为田渊栋吸引了相当...
Loading stats... -
一些问题的回答
本次问答应“将门创业”之邀所写,专栏版本内容有扩增。 问一:能否和大家简要介绍一下你的背景,以及你现在在Facebook的工作内容和强度? 我之前在谷歌无人车组工作了一年三个月,自从2015年1月加入...
Loading stats... -
第一次半马感想
原来主办方通过Tracker还是能知道冲线的时间。万幸没有白跑这一次半程马拉松,最后成绩是2小时2分47秒。 [图片] === 早上刚跑完旧金山的半程马拉松(21.1公里或13.1迈),用时约2小时1...
Loading stats... -
两篇DeepMind ICML的点评
【原文应新智元之邀所写】 点评 Dueling Network Architecture for Deep Reinforcement Learning (ICML Best paper) DQN系列...
Loading stats... -
围棋引擎DarkForest开源了
我们的围棋引擎DarkForest开源了。见以下Github链接: https://github.com/facebookresearch/darkforestGo ,目前主要是围棋的MCTS引擎和训...
Loading stats... -
快速迭代的人工智能
本来我们这领域步调就快,因为杂志论文的内容滞后,大家都看会议论文,一年两三个顶会,半年一年的研究周期。但因为是双盲评审,就算有别人和自己做得相近,投稿时也是两不知晓,大不了同时中稿同时发文。Arxiv...
Loading stats... -
UEC比赛总结
上周我和朱岩去日本电气通信大学(University of Electro-Communications, UEC)参加了第9届UEC杯计算机围棋比赛,获得了第二名的成绩和与小林光一九段下让3子棋的资...
Loading stats... -
赛后感言
AlphaGo的比赛以4:1的比分结束了,说几句吧。 大家可能一直有误解, 计算机解决问题靠暴力,而人则靠智能。其实在面对指数级别的解题空间时,机器的暴力搜索所能覆盖的范围,不过是沧海一粟。我现在越来...
Loading stats... -
第四局AlphaGo败招的分析
第四局李世石的78手L11挖被大家誉为“神之一手”,在DarkForest的策略网络输出里排第31位,而J11靠排第10位。因此我觉得可能是AlphaGo没有算到这一步。如果对方下了一手机器没算到的棋...
Loading stats... -
DarkForest对AlphaGo和李世石前两局每步的胜率估计(仅供参考)
DarkForest 75k rollouts. DarkForest现在是KGS 5d,一开始黑棋胜率都会低点,但于棋力关系不大。 [图片] [图片] 首先说明一下每个数据点是DF在当前局面下给出最...
Loading stats... -
AlphaGo的分析
最近我仔细看了下AlphaGo在《自然》杂志上发表的文章,写一些分析给大家分享。 AlphaGo这个系统主要由几个部分组成: 1. 走棋网络(Policy Network),给定当前局面,预测/采样下...
Loading stats... -
《博士五年总结》及我其它过去的博客文章
应大家要求整理了一下,链接列于下: 《博士五年总结》 http://yuandong-tian.com/five_year_summary_of_PhD.pdf 《数学的用处》 http://yuan...
Loading stats... -
读博文有感
读 Deepmind,蜘蛛坦克,小笼包_sunchun79_新浪博客 有感,以此诗纪念: 一日破关证大道,每使英雄泪遣怀, 铁马冰河梦中见,醒时还归俗务来。 千峰峭岩目易及,攀援方知人世艰, 拼却热血...
Loading stats... -
2015年末总结
2014年年底的时候,我辞了在谷歌无人车组的工作,和老婆开车穿越死谷,看着白茫茫的盐海,一望无垠。 无人车的前景确实广阔,要是能做成,那对整个世界将是革命性的。犹记得2013年年底,我还写过一篇推广无...
Loading stats... -
关于围棋AI的新思路
时隔两年,又找到了赶文章的感觉,17号坐飞机从加州飞回匹兹堡,身在万米高空还在跑实验改文章,飞机上的网络实在是破得可以,接了VPN登陆到公司机器,按一个字符都要等半秒钟才看到回显,但是亏得前一天晚上写...
Loading stats... -
碎片化时代如何读写
我们每天都经历快节奏和频繁被人打断的生活,没有大块时间可以拿来阅读和写作。退隐江湖归农种地,望南山悠然捧卷铺宣,这当然是不可能的,"跑得慢点等等灵魂"之类的也没什么可操作性。那么我们如何才能提升自己,...
Loading stats... -
转职半年总结
我半年前从谷歌X的无人车组跳到Facebook的人工智能实验室(FAIR),感触良多,这里写一些分享给大家。 虽然F和G并称一流的IT公司,但是其实内部是很不一样的,甚至可以说完全相反。加入FB之前,...
Loading stats... -
一些小文章
劝人未成,留稿于此。或有一二人得我心意,足矣。 === 兄台此言差矣。一无所有者,千金不能加其有;身怀绝技者,赤贫不能掩其芒。譬如利刃在囊,脱颖而出,天道也。自废其才,自薄其能,逆天道而行者,若夏桀商...
Loading stats... -
关于现在人工智能预测的一些冷水
最近有关人工智能和深度学习的各种预测满天飞,作为圈内人,我来泼点冷水。 我们常说科技树科技树,这个比喻是非常贴切的,现代科技的基础理论并不复杂,做个摘要,大概二三十页也就够了,这些构成了树的主干,而基...
Loading stats... -
谈一谈CMU导师和学生的互动方式
原文发表于 谈一谈CMU导师和学生的互动方式 导师和学生本质上是合作关系。因此,找到互惠互利的工作方式是开展一切学术活动的基础。如果学生能力不高,无法完成导师安排的工作,那导师就不会接收他;如果导师没...
Loading stats... -
关于”做人工智能是否一定要学点生物“
原问题及答案在 如何看待饶毅的「人工智能还是伪智能」命题? - 人工智能 ,这里做一整理,以作专栏开篇。--- 不觉得做人工智能一定要先学点生物。 首先,大脑的设计不一定最优。本着”能用就行“的原则,...
Loading stats... -
业余做研究的经验
利用业余时间做研究的方法和心得
Loading stats... -
如何学理工科
理工科学习的方法和要点
Loading stats... -
数学的用处
从工程师角度看数学的作用和学习方法
Loading stats... -
博士五年总结系列
CMU博士五年的经验总结:研究、写作、演讲与时间管理
Loading stats... -
The Mission En/中文
A short story about duty and vanity, persistence and solitude
Loading stats... -
优秀
关于竞争、原罪与自我认知的短篇小说
Loading stats... -
锁箱
通过年轻人与老锁匠的对话,反思人生中徒劳的追求
Loading stats... -
桨
以诗意笔触描绘追赶夕阳的场景,展现超越的生活智慧
Loading stats... -
有关数学和Research的几个短篇
学数学的七个阶段、数学与逻辑思维、工程师眼中的数学
Loading stats... -
我的CVPR历程
记录在微软亚研院完成CVPR论文投稿的一个月冲刺过程
Loading stats... -
旅游记闻(五):西部之旅——旧金山、迪士尼与尾声
2004年冬环美游记西部篇终章,旧金山三日游、约瑟米蒂国家公园、迪士尼乐园,以及旅程的结束
Loading stats... -
旅游记闻(四):西部之旅——最长的一天、洛杉矶与圣地亚哥
2004年冬环美游记西部篇,24小时内四次飞机横穿美国,游历好莱坞、环球影城和圣地亚哥海洋世界
Loading stats... -
旅游记闻(三):东部之旅——纽约与波士顿
2004年冬环美游记东部篇,在纽约五天游历自由女神、世贸遗址、华尔街、时代广场跨年,以及波士顿的哈佛与MIT
Loading stats... -
旅游记闻(二):东部之旅——华盛顿与费城
2004年冬环美游记东部篇,游历华盛顿的白宫、博物馆和费城的独立纪念馆
Loading stats... -
旅游记闻(一):楔子与芝加哥
2004年冬Purdue留学期间21天环美游记的开篇,从Lafayette出发,首站芝加哥
Loading stats... -
我在Purdue的学习体会
美国普渡大学五个月学习经历的观察与反思
Loading stats... -
走向成功之点滴
大学生成长过程中的人生感悟
Loading stats...
Filter by tag:
All CVPRSTEMnovelshort storysummary专栏人生博士学习学术小说总结感悟成长教育数学方法论旅行求道之人游记留学知乎短篇研究经验美国