博半我在想什么

  学而不思则罔,思而不学则殆。读博半年,恰逢年终,把自己这半年来主要思考的一些问题记录下来。待得明年今日,看看哪些问题想得幼稚,哪些自己已经不再思索,哪些问题想的更为深入,哪些问题推倒重想。
  总的来说许多问题仅仅是脑中意淫,并未考据论证;想的问题主要集中于可视化以及Research和Paper,有点狭窄,可能跟刚入学有关。希望明年眼界更为开阔。


为什么人类没有进化成可以继承记忆?

  在知乎上看过一个问题:自然科学是否会因自身的复杂而走向停滞?
  Skyline答道:

  当然会,当通过学习接触到自然学科前沿需要的时间超出人类寿命的时候,发展就自然而然地停滞了。其实不用超出寿命,超出大部分人成家立业的年龄就足够了。事实上现代的科研在细分和专门化到大量博士成为搬砖工的同时,完成足够训练的时间已经接近人类的最佳生育年龄了。

  那为什么在漫长的进化史中,没有出现记忆能够遗传的物种呢?类似于三体人一样。
  我想了很久没想到答案。我记得蛋白质的空间结构是可以保存在DNA里的,假如有一种物种,能把大脑后天训练的pattern、结构信息保存在DNA里,遗传给后代,得以重构大脑,这样是不是就起到了一种遗传记忆的效果。
  但是如果记忆得以遗传的话,那必然就有个伦理道德的问题,家庭或许不复存在,社会结构会是全然不同的。这样的种族应该很快会毁灭才对,因为每个人身上都活着好许多人,每个人都要挣扎在“我是谁”这样的问题上不得解脱。
  忽然想起萨尔那加们好像认为具有群体意识、抑制自我意识的种族才是完美形式的生物,假如有一种生物可以遗传记忆,我觉得他们的自我意识也要被抑制才行。

什么是好的可视化?

  我说的都是信息可视化。先从脑后插管说起。
  在我们的现实生活中,信息需要通过载体来传递。我们获取信息主要依赖于听觉与视觉,与之对应的两种信息载体即为语言和文字。我们将信息编码成语言和文字,然后通过听觉和视觉来接收,再经过大脑解码,从而获取载体背后的信息。
  如此获取信息是要耗费许多时间的,首先你摄取信息载体要时间(听别人说话是线性的,看文字可以是并行的),其次解码信息也要时间(理解一段话是什么意思)。如果我们获取信息能像电脑一样直接复制黏贴的话,人类或许早就跑步进入共产主义社会了。
  在人类的想象中,有一种极致的获取信息的方式就是脑后插管,就像给每个人连上一条USB线,信息直接输入至大脑中。这种方式大家应该很熟悉,比如黑客帝国中主角们连接Matrix;阿凡达中纳威人用脑后的辫子来交流传递信息;星灵依靠神圣的卡拉将彼此连接在一起;攻壳机动队等等。
Brain to Brain
  依靠脑后插管,信息不再需要载体,而是可以直接塞进你的脑子里;信息也不再需要理解,不再需要大脑解码载体来理解载体背后的信息。
  遗憾的是,我们脑袋上并没有网线或者USB接口,在肉体进化出这些东西之前,我们主要是通过听觉和视觉来获取信息,而大部分的信息,我们是通过视觉来获取的。
  在人类漫长的历史中,我们发展了文字用来记录信息。最早的时候是象形文字。后来随着生产力的发展,这些象形符号高度抽象后就成了现在的形意字,比如汉字(当然还有表音文字,不过那是往另外一个方向发展的文字)。用文字这种载体来传达信息,极大的限制了人类摄取信息的速度,没有充分利用好视觉系统的能力。从某种意义上来说,搞可视化的人认为眼睛就是人体上的八针USB接口,最高传输速度1G每秒。而目前通过文字传输信息的方式类似于USB1.0协议,传输速度十分缓慢,只有10M每秒。可视化科学家希望通过研究开发出USB2.0、3.0协议,从而提高信息传输速度达到100M每秒,甚至更高。一个好的可视化应该能让用户有一种开启“上帝之眼”的感觉,一眼看穿三界六道,洞察天地道理。
  想到这里,有很多之前令我困惑的问题,我想明白了许多。

  • 以前读过一些可视化的paper,它们用上一些很先进的机器学习算法,分类聚类什么的,对数据处理出一个结果,再设计一些展示方案将其可视化出来,然后说通过我们的这个可视化设计,发现了什么什么insight。当时我是很迷惑的,感觉这里没可视化什么功劳啊,我已然用机器学习算法得出了结果,你可视化不过是漂亮得把这些结果show给我看罢了。
      现在按我对可视化的理解来看,这些paper是不怎么好的,因为他们搞歪了,他们设计的系统里面的确没可视化什么功劳。虽然说一个美的展示很重要,但这只是锦上添花不是雪中送炭,他们没有抓住主要矛盾,而是在次要矛盾上做文章。
  • 以前读的paper,发现大家都喜欢请domain expert来评价自己的visual design好不好。当时我觉得这个方案挺搞笑的,感觉这好像是请广告代言人似的:“连某某专家都说好,那看来我的产品真是好!”。
      现在按我对可视化的理解来看,这个方案其实是很靠谱的。因为在可视化的视角里,每个人的大脑就是一台处理器,而domain expert的大脑就是内嵌高级数据分析算法的处理器。从前这些高级处理器受制于USB1.0协议,IO是瓶颈,不能快速摄取、分析数据。现在我们让他们尝尝我们的2.0协议,看看是不是能更好的进行分析。

  我们学习一门文字,需要输入一定量的语料来训练我们的大脑,最后训练好的大脑就像是一个模式识别机,自动将看见的文字符号解码映射成对应的信息。类似的,可视化作为一种信息载体,同样需要大脑的解码。但是显然我们没有那么多的时间和数据去训练用户的大脑,让他们迅速建立起可视化符号到信息的映射。所以一个好的可视化设计,应该充分的利用用户大脑中已经存在的映射模式。这在可视化中叫隐喻。
  隐喻应该尽量满足普适性的,不因种族文化而有过大的差异。比如,我举一个不是很精妙的例子,中国人都知道龙代表的是帝王天子,假如我做一张帝王籍贯分布图,用龙的图标来encode皇帝,中国人一看就懂,但是外国人可能就不懂,所以这样的可视化是不好的。
  说到隐喻,我就想到两个经典的出自我们组的得意的例子:用河流来隐喻时间的流逝,用花粉传播来隐喻信息的传播。这两个我觉得就很好,充分利用了用户脑中已存的映射,而且还是很普适性的映射,世界各地各种文化的人一看都懂。
  充分利用了用户大脑中已存映射的可视化设计就很直观,反之则很不直观。有些可视化设计,复杂无比,的确在有限的空间里encode了巨量的信息,但是这却不见得好。用户不得不强行现学,建立从可视符号到数据信息之间的映射。这就好比我写六个字“唵嘛呢叭咪吽“,然后告诉用户这代表的是元素周期表的拓扑结构,这就让人很囧了。这个例子可能很糟糕,但是有些paper里的visual encode给我的就是这种感觉。

以后的VIS?

  我有一卡小笔记叫做“陈竹天的错误远见”,专门记录自己被打脸的愚蠢预见。现在我也来预测一下vis的未来。
  我想人类文明发展,那么长远的岁月过去了。从维度上讲,从平面图发展出透视是一个重大的飞跃;从二维发展到三维,再发展到虚拟现实,是一连串的重大飞跃。虽然目前可视化领域的大佬们都不支持三维、不支持景深(之前mentor跟我说是大佬们认为会有元素间的遮挡,这样不好,所以反对),但是怎么说历史潮流浩浩荡荡、VR发展如火如荼,以后大家都带上hololens之后,不搞三维总觉得哪里不对。
  再从动画上讲,从静态的图画到动画、电影,也是一个重大的飞跃。借着动画和电影,信息的传输速度其实是提高了许多的我觉得——本来很厚的一本漫画转成动画一集就完了,一本很厚的书转成电影2个钟就讲完了。虽然目前可视化领域的大佬们都不怎么支持动画(据我所知说是因为人的短期记忆short term memory问题),但是怎么说历史潮流浩浩荡荡….
  维度提升,动态展示,我猜想可视化是不是以后怎么也得往这两个个方向来一下。

可视化的商业化?

  假如经过可视化科学家的不懈努力,真的研究出了USB3.0协议,如何才能把该技术商业化呢?现在比较成功的可视化软件公司比如Tableau,感觉像是一个传统的软件公司,就是卖软件的。感觉卖软件是上一个时代的模式了,现在都是互*网模式。除了卖软件,可视化还能有别的商业模式作为出路么?
  此外,还有一个”经济护城河”的问题。引用马克·塞勒尔的一段话:

  什么样的优势才能使你们免受残酷的竞争?如何找到合适的点来建立起”经济护城河”?如果技术是你唯一的优势,那么它并不是建立”护城河”的资源,因为它是可以、而且最终总是会被复制的。这种情况下,你最好的希望是被收购或者上市,在投资者认识到你并没有可持续性优势之前卖掉所有股份。科技是那种寿命很短的优势。还有其他的,像一个好的管理团队、一场鼓动人心的广告行动,或是一股高热度的流行趋势。这些东西制造的优势都是暂时的,但它们与时俱变,而且能被竞争者复制。
  ”经济护城河”是一种结构性(structural)的优势,如果你的竞争者知道你的秘密却不能复制,那就是一种结构性的优势,就是一条”护城河”。
  在我看来,实际只有4种难以复制且能持久的“经济护城河”。一种是规模经济,沃尔玛、宝洁、家得宝就是例子。另一种资源是网络效应,如eBay、万事达、维萨或美国运通。第三种是知识产权,比如专利、商标、政府许可或者客户忠诚度,迪斯尼、耐克和Genentech即是此中典范。最后一种是高昂的用户转移成本,薪资处理服务公司沛齐(Paychex)和微软就受益于此,因为用户转向其他产品的成本实在高昂。

  可视化作为一种技术,是不能够成为经济护城河的,更别提可视化的核心之一就是要让人类更容易明白,这意味着可视化的技术剽窃复制起来相对简单。
  好在可视化的适应性比较好,可以很容易的跟各种方向的业务融合到一起,max adaptive。
  又想起不知道谁说的话:要成功,三条路,Be the first, be the best, or cheat。Tableau应该是沾了be the first的光,在be the best上也是缺点难寻,要干赢它看来只能作弊了,whoseyourdaddy。
  幸运的是中国相关市场还较为空旷,尚未被占满,路漫漫其修远兮。

(量化)交易 + 可视化?

  感觉挺冲突的,量化有个重要的目的和原则就是排除个人情感来做交易,但是可视化却把人给引入其中。或许可以利用可视化来辅助交易员,但是却不能跟量化搞到一起去。唉,还是先补知识吧。
  路漫漫其修远兮,吾将上下而求索。

采取什么方式发paper?

  以前我想象中的发paper有两种方式:一种是不断挣扎前进,练功通关,使劲憋,最终憋出一篇paper,如此做paper是一个学习的过程。另一种是回首往事,大功已成,整理自己的工作,最终生成一篇paper,如此做paper是一个总结的过程。
  现在我感觉发paper的过程一般都是这两者的融合,只是两者的比例不同罢了:有的人是挣扎多一些总结少一些,有的人总结多一些挣扎少一些。
  孰优孰劣我也说不清。挣扎着发paper,可能反馈更快,立竿见影,就算被拒,也多一份经验,有的时候走运了paper被收,那真是超额收益;坏处是容易走火入魔,为发paper而发paper,虽然有paper,但是本事没多少。总结式发paper,突出一个稳和深,功力深厚,水到渠成,看似闭门造车,实则出门合辙;坏处是反馈周期长,难熬,你说自己功力深,别人说你没paper我不信。
  依我目前的喜好来看,我觉得最好是两者有机结合吧,以稳为主以憋为辅,对准一个topic使劲深挖,到了该投paper的时候就投,投完了就继续挖下去,中不中paper随意。但是如果是这样的话,topic的优劣就变得很重要了,要是深挖的topic是个死胡同,那就真是耗费了大好青春,到头来一事无成。现在很多年轻人拿到一个topic做了两下做不出,就会想要换topic,毕竟青春那么宝贵,怕掉进坑里去。

如何才能选一个好topic?

  大海航行靠舵手,万物生长靠太阳,干革命靠的是毛泽东思想。我觉得最靠谱的方法就是听长者的,比如听导师的。
  以前年轻的我思考过另一个问题,我想那些CEO们、董事长们,啥实事都没干,凭什么拿那么高工资?后来我想是因为他们解决了方向问题。这不是一个简单的活儿,他们指一个方向,全公司上下几百几千号人就要往那个方向使劲努力,如果那个方向是个死胡同,所有人都得喝西北风。决策比之执行怕是难上许多倍。
  在解决方向问题的时候,我认为智慧比智商更重要。我之所以会有这样的观点,一方面可能是因为在方向问题上智慧的确比智商重要,另一方面可能是因为我的智商不够高。要增长智慧,我觉得只有三条路:多读些书,多经历些人和事,多长几岁。长者们读书更多,经历人事更多,长的岁数更多,在面临方向的抉择时,是不是更应该参考他们的意见呢?
  至少23岁的我是这么认为的。

我要paper来干嘛?

  目前,我觉得不同阶段的paper代表了不同的能力。就我们vis领域来举例子,头两篇paper我觉得意味着具有了发paper的能力,不管是憋也好总结也好,能发出一两篇顶级paper,就意味着你发paper的能力和基本的研究能力是够线的,于是得以毕业。
  两篇后的paper除了研究能力外还多了一个学术地位的属性,2-10篇意味着researcher的个人研究能力和学术地位,10篇往后是professor or leader的带队研究能力和学术地位。
  所以,假如我的观点是对的,那么如果不追求学术地位的话,就没必要追求2篇以后的paper了。
  当然2篇top paper也不是个容易事儿,要是把要求放低点,不追求基本的研究能力,只想要半本的研究能力,或许1篇也是够的。可是如果只要半本的研究能力,那还读个P的博。

为什么道理都懂然而办不到?

  写另一篇博文里了,《道理我都懂》