程序员人生 网站导航

《近匠》第04期:移动开发技术访谈,多看科技CTO王毅――阅读未来

栏目:互联网时间:2014-09-12 05:28:45

CSDN移动频道推出移动开发系列访谈《近匠》。新一年起,我们将走近更多移动开发者与移动开发服务商,从深植于软件及硬件领域的“工匠”们的口述中,窥探移动互联网趋势与走向。本期CSDN移动对话移动阅读平台――多看科技。

自2010年多看阅读成立以来,已经经历了3个年头。它从最初人们口中的“Kindle必刷的系统”,逐渐蜕变为现在跨Kindle、iOS、Android多系统的数字阅读平台。目前,多看的图书已达12000本,但每本从获得版权到最终上架并非全都一帆风顺。做数字化出版不得不面对哪些问题?自从2012年小米并购多看后,多看与小米的技术团队又有怎样的协作?多看作为中小团队的技术经验有哪些?在多看眼中,实体书数字化在国内正遭遇哪些难题?不妨让多看科技副总裁兼CTO王毅与我们聊一聊。


多看科技副总裁王毅

CSDN:请您介绍一下个人的经历,以及多看阅读团队。

王毅:我的工作经历比较简单。我从北大毕业后,就一直在北大方正,当时王选老师还在任。我在方正主要负责的是排版软件的相关工作,然后从2000年起转向了数字出版领域。自从那时起,就在数字出版领域,工作了很多年,主要是做与数字相关的基础的技术研究工作,在方正最开始从方正电子,到最后方正技术研究院从事数字出版相关的工作。大概在2011年8月,我加入了多看,当时多看成立的时间也比较短,算起来,到现在为止,在多看工作也有两年多的时间了。

整个多看阅读团队大概有160人左右,分为内容、产品研发和运营等几个团队。现在多看阅读的技术团队大约有30多人,很多技术骨干都是以前与我一同工作至今的,其中也不少曾在方正研究院共事过的同事。

CSDN:多看阅读的技术团队都采用哪些技术服务?

王毅:技术主要是自主研发,实际上多看整个平台,不管是云端,还是客户端都是自己搭建的,这是一套比较完整的包含数字出版发行、销售等环节的一个平台。我们的客户端也已经覆盖了从Kindle到iOS、Android,再到Web等几个主流的平台。

实际上,多看在2010年创立之初是从开发Kindle的中文系统出发的。因为当时Kindle没有中文系统,而且Kindle也还未入华,在国内能买到的都是水货,我们基于它做了一套完整的中文系统。这也使得Kindle可为大多数中国人所使用,方便更多用户操作和阅读。当然,Kindle入华则是后来的事情了。

CSDN:从多看阅读发布第一个版本至今,技术团队做过哪些改进,遇到并解决了哪些问题?

王毅:我们发布过很多版本,以Kindle版为例,从发布第一个版本开始,我们每周都更新一个新版本,一直坚持至今。同时,其他平台版本的更新频率也非常高。在2010年到2011年的起步阶段,我们主要是以开发Kindle的中文系统为主。

随后,在2011年下半年,我们开始尝试向Android和iOS平台拓展。当时,我们发布至两个平台的产品形式有所不同,在Android上我们开发了一个阅读器,而在iOS平台,我们所遵循的是“精品阅读”的理念,所以最开始从单行本入手。在此期间,我们也在多个平台发布了客户端。

从2012年起,我们开始准备发布“多看书城”,这是一个正版电子书的销售平台。它在2012年的5月31日率先在iOS版本上正式发布,随后Kindle、Android和Web版客户端也逐一接入了这个平台,逐渐形成现在大家所看到一个全平台的正版电子书发布和销售渠道。

还记得,在最开始时我们的电子图书加工、制作进度很慢,资源也比较匮乏,所以上线时书城中只有100本书,其中免费书籍和付费书籍各占50%。但是现在,书城已经拥有超过12000本正版图书,而且每一本都是经过我们精心加工制作的。除此之外,与去年发布第一版本时相较,各个平台的终端数和用户数也得到了很大的提升。

CSDN:就像每一家实体书店都有自己的特色一样,作为一个移动阅读应用,多看的特色是什么?

王毅:我们认为多看最大的特色其实就是极致的阅读体验。所有用户在我们的平台上都能够享受到最好的数字版图书,以及最好的数据阅读服务,这就是我们最大的特色。我们应该是在国内唯一一个跨越了从Kindle到Web、iOS,再到Android,几乎所有的移动系统的电子书平台。我们在每本书上付出了很大成本去进行制作。我们的客户端具备跨平台特性,阅读体验保持着一致性,比如阅读进度、阅读笔记,甚至将来书架里所有的内容,都会云同步。

我们在最近推出了一些社交化服务,比如说书友圈,它能够有效地拉近读者和读者之间的距离,甚至作者与读者之间也能进行互动。我们平台上有些书的作者会直接在书友圈中和读者去互动交流,这在实体书店中是很难做到的,但借助移动互联网,我们可以轻松拉近他们之间的距离,方便他们相互交流,这是完全不同的体验。

CSDN:电子图书与纸质图书的制作流程是不同的,多看阅读在这方面是怎么做的?

王毅:我曾在知乎写过一篇贴子,简单介绍了多看对每本电子书的制作流程。我们的每一本书都和其他平台完全不同,多看书城中的书籍很多都是图文混排的,我们深谙此道。而且我们对排版的字体,以及许多排版细节要求都很高。我们制作每本书之前,首先需要出版社提供数据源,然后我们再根据数据源进行加工制作。从排版设计的角度讲,我们的理念是“千书千面”,希望每一本书都有它独特的风格和阅读体验,包括封面设计、版面设计,甚至文案编辑都会有所不同,有些书会加入视频(如,柴静的《看见》试读版),有些会加入交互。我们不完全是追求与实体书的一致,我们希望电子书的体验完全超越实体书。

在多看中,不同类型的书,会被赋予完全不一样的阅读体验。以计算机类图书为例,这也是多看最具特色的图书之一。与其他平台不同,书中所有代码不是用图片形式显示,而是以真正的代码块形式显示的,我们为此专门扩展了交互代码块的定义,所有计算机类的图书都不能直接使用代码图片,而必须全部是等宽字体排的代码文本,代码是可以交互的。


技术类图书

手机屏幕对文字的缩进、排版存在很大的限制,但代码往往比较长,如果它不符合手机屏幕对缩进、排版的要求,代码段看起来会非常乱,不利于阅读。但通过一些交互的操作,用户可以阅读到原版的格式规范的代码。

完成排版后,我们的开发工程师会利用业余时间对所有的代码进行审校,这也让图书中的代码比实际纸质图书更准确、更规范。不过,加工成本很高,而且周期都很长。

CSDN:制作一本书的周期是多久?

王毅:现在计算机类图书的制作周期一般在两周以上,因为它的流程很长,其中包括审核、校对、制作等,而且计算机类图书的加工成本是最高的。

CSDN:就像之前所提到的,一些图书会加入视频,我们发现也有一些图书会加入轮播图形式的插图(如,《转一转希腊》)。

王毅:这是专门使用了我们的“画廊”技术。在很多摄影类图书中,我们大量地使用“画廊”,因为摄影类的图书,经常会拿不同曝光、不同光圈下的图像进行对比,但你会发现其实图片大小是一样的,所以采用“画廊”的交互形式,能让用户滑动浏览图片,非常便于对比在相同环境下使用不同参数的照片,它阅读体验比纸质书籍会更好。

CSDN:在电子书制作方面,多看有哪些独特之处呢?

王毅:交互式代码是多看独有的,其他平台都不具备这样的特性。当然还有很多细节也非常与众不同,比如说多看的图文混排、多字体排版、独特的样式和字体,这在别的应用中是没有的。

另一个独特之处就是多看的纠错和更新系统。每本书就像一个应用一样,它会有自己的版本号,会根据用户反馈进行定期更新。如果读者在读书时发现了错别字,他可以点击选中它,并发送纠错报告。多看的后台有一个数据整理系统,每天定时收集这些用户的反馈报告,系统会自动生成相应的错误报告,然后发送到我们的工作流系统里。我们的编辑团队会根据这些反馈做出相应处理,然后更新图书版本。这时用户就会在客户端就会看到一个温馨提示,告诉用户图书更新了,用户甚至可以查看更新记录,在图书的详细信息页里面也可以浏览它的更新历史。用户只需点击下载更新,就可以继续阅读了。

我认为这种更新机制完全颠覆了传统纸质图书的出版流程,因为实体书的出版无法做到快速更新,再版最短也需要6个月。但是我们基本上在一个月之内,就可以把用户提交的Bug全部修改完,然后更新上线。用户也能很快的得到反馈效果,他看到的电子书的内容精准程度,通常比实体书更高。同时,我们与出版社保持沟通,获取刊物的最新信息,这使电子书臻于完美。频繁的更新使得数据越来越准确,电子书的质量会变得越来越高。

CSDN:在电子书中加入视频、图片等多媒体元素,无疑会让文件体积增大。你们会如何处理?

王毅:我们会做一些处理,会对其体积进行控制,因为数据量太大也会影响用户的下载体验。但是文件体积变大是不可避免的,尤其对图文混排的书,多媒体图书体积相对较大。不过现在的网络带宽在不断提升,下载速度也在不断的加快,我们认为这已经不再是什么太大的问题了。

CSDNPDF智能重排和切边功能是如何实现的?

王毅:这个功能也是一个特色,因为多看阅读除了是多看书城的终端之外,在各个平台也是很好的一个阅读工具,它支持主流格式,比如TXT、ePub、PDF等。同时,每一种格式在多看中都会有自己的特点,比如ePub,我们很好地支持了ePub标准和它的CSS解析。在很多的阅读器中,ePub仅被简单当作了一种的文本格式,这一种误解,其实不利于ePub标准的推广。实际上,ePub标准主要的核心优势是采用了HTML5和CSS技术,可以做出非常精美的电子书,包括多看书城上的很多书都是ePub格式的,所以我们在ePub的兼容性方面应该比绝大多数的应用更完美。

我们有很多用户,甚至会自己制作ePub图书放到多看里面阅读。前一段时间,我们基于ePub做了一些扩展的开放标准,开放了一些多看的扩展规范,比如说我们的交互式的文内注,这个扩展规范已经开放给了用户。我们有一些用户专门针对我们的扩展规范,做了一些电子书。这些开放的规范都可以在我们论坛找到。

关于PDF格式,我们对PDF投入较大的就是重排功能,现在不论是文字版还是扫描版的PDF都可以实现重排。PDF是作为一个版式的文档,它其实在小屏幕上的阅读体验并不好,所以为了能让它适应小屏幕的阅读,就需要借助重排的功能,目前这方面我们也在努力,包括切边,包括重排扫描版的处理。

然而PDF重排是个很复杂的过程,因为PDF主要是面向印刷,很多PDF本身丢失了文档的结构信息。它不像重排一个TXT或者Word文档,这些文件都是有段落结构的,而PDF则不同,它是一种基于矢量的文件格式,最终印刷效果是否高保真,是否与原始版面完全一致才是它的重点,但它的文档却缺失了逻辑结构。所以PDF重排过程会涉及到一些对版面理解的算法。你可以将PDF理解为一张图像,你用算法去理解这张图像,其中哪些是段落,哪些是标题,哪些是图,以及哪里是段落的起始和结束的位置,这些信息都需要以算法来进行处理。

CSDN:在多看在线书店中搜索书籍时,输入法国,搜索结果中不仅仅有书名包含法国一词的书籍,还有法国作家的著作,以及中国作家写的相关图书。多看的搜索基于什么?

王毅:现在我们并没有在搜索方面投入很多人力,但是我们做了一些管理性的工作。多看不仅仅针对书名、作者进行搜索,还包括标签。我们编辑会对每本书加上标签,这是加工制作流程的一环。编辑会根据他的理解,为每本书打上相关的标签。这些标签用户也可以在图书详细信息页中看到,如果用户点击标签就可以进入相关的标签书单。另外,我们对标签有多个维度,比如地理的纬度、人名的纬度等,都有比较严格的限定。

CSDN:小米并购多看为你们带来了什么样的变化?从技术层面讲,有哪些协作呢?

王毅:最明显的就是基础技术的互通,现在我们所有的应用,包括多看阅读,全部迁移到了小米帐号的体系下,多看现在也使用小米帐号,作为一个身份认证系统,小米帐号打通了整个小米的业务系统。用户可以基于小米账户做很多事情,比如访问云空间,以前的多看帐号是没有这项服务,但是随着无缝迁移至小米帐号后,用户可以通过小米账号登录,同步账号中的图书、笔记等信息到小米云空间。

与此同时,米币支付系统也是一大重点。支付系统是小米生态中非常重要的一环,现在游戏、主题和阅读都以统一的支付系统贯穿起来。同时支持各种各样的充值的方式,这样我们的用户不管是在移动端,还是在Web端都可以很方便地使用米币来支付,这也是合并之后的一大变化。

CSDN:多看目前有100多名员工,算是一个中等大小的团队。从技术层面看,您认为对于中小开发者来说,什么样的开发工具或服务是必需的?

王毅:我觉得从开发团队管理上讲,采用适合自己的开发工具是很重要的,因为这有利于大幅提升他们的开发效率。就好像我们的代码管理方式已经历了好几次的改变,最初我们使用的是微软一套代码管理系统TFS,后来开始使用SVN,由于SVN在分布式处理方面存在一些缺陷,所以最终采用了Git。

我认为选择工具的目的是尽量杜绝以往手工作坊式的开发方式,使开发更有条理和规范。与我们现在采用Git做代码管理的道理一样,因为Git的特点是分布式开发,它很便于分支,同时它也很轻量级,跨平台性能好,现在也是主流的代码管理工具。

我们的Bug管理现在采用的是JIRA,这也是目前整个小米体系下大多数团队所采用的平台。这个平台可以通过多种方式扩展,可定制接口和模块,轻量、灵活也是它的重要特性,能够有效地帮助中小团队解决项目管理问题。


CSDN:近几年,电子书让很多传统的书店的经营越来越困难。您觉得像多看这样的电子阅读产品,于整个出版业来说产生了哪些影响?

王毅:我觉得我们最大的影响是对电子书阅读体验的改变。我在数字出版相关技术领域工作多年,电子书的概念很多年前就存在了,只不过那时移动互联网、移动设备尚未普及,受限于大环境,所以当时的阅读滞留于桌面之上,更谈不上什么移动阅读体验了。支付也面对着同样的问题,用户还没有在手机上进行支付的习惯。随着移动、支付等多个领域的发展,它慢慢使得数字阅读会变成一个趋势。以我们在数字阅读领域多年的经验来看,过去对阅读体验的重视程度并未被提到现在这样的高度,因为过去主要解决的还是能不能顺畅阅读的问题,而阅读体验,受硬件的限制,近乎无从谈起。所以,尽管当时电子书已经存在,但实际上用户对电子书的使用率很低,它与实体书的差异很大,还远远达不到可以替代实体书的程度。例数早期深耕数字阅读领域的公司,不管是方正、超星、汉王,还是清华同方,当时都做了很多推动数字化阅读的尝试,可最终都没有一款应用能为大多数用户所接受。

从多看的角度来讲,我们最大的特点就是出色的阅读体验,它可以让更多的用户真正认识到“实体书并非不可替代”,而且会让更多人逐渐接受付费下载。虽然以前也曾有人尝试做付费阅读,但大家买了书之后,可能发现它的阅读体验还不一定比盗版电子书做得好。但随着阅读体验、移动快捷支付的体验,甚至包括多设备平台的无缝衔接、社交等增值服务的日渐增多,以及体验的提升,会潜移默化地让这些读者觉得付费是值得的。虽然我们平台上的用户数并不是很多,但是用户的黏性非常高。好的阅读体验以及不断增多的图书资源会使得用户接受通过数字阅读渠道进行消费。当越来越多的人认识到付费阅读,或者说数字阅读的趋势之后,对于作者和出版社来讲,他们得到的回报也会水涨船高,则更愿意把优质的内容投放到数字平台上,这样就形成了一个良性的循环。

从目前来看,传统的实体书店正是在走下坡路。店面租金、物流配送、库存等问题,让实体书有很大的局限性。而数字阅读平台则不存在这些问题,这也是它的优势所在。

CSDN:你们如何应对电子书的盗版呢?

王毅:我们在这方面做了很多努力,我们也会采用DRM系统,同时,我们对数据安全也会做严格的控制。所以,其实目前可以看到的针对多看系统的盗版现象,可以说几乎没有。

对于盗版这件事,乔布斯开始销售音乐时也曾面对许多盗版音乐的问题,他曾说“与其花上30到60分钟,去搜一个盗版音乐,那么你为什么不用1分钟花1美元去买一首歌呢?这样节省下来的时间难道还不值1美元吗”?同样道理,对于我们来说,当我提供的图书质量足够好,它内容足以吸引用户,同时它的价格也足够吸引用户的时候,与其花大量时间,搜出一些可能错字连篇、排版混乱、无法同步阅读笔记的电子书,还不如用很低的价格去享受最优质的服务。说实在的,我们图书的价格已经非常低了,很多图书都在6块钱以内,如果你花一瓶矿泉水的钱,就能买到一本好书,那你为什么不支持正版呢?当然,打击盗版也依赖于环境,随读者的版权意识越来越强,盗版也将不再是个问题。

CSDN1125日,美国法院宣判Google数字图书馆计划合法,对于此事您怎么看?

我认为还是应该积极地去看待这件事。就Google的理念及其公司价值来看,这对于促进实体书数字化来讲有正面的引导作用。但回过头来看国内,其实国内的图书数字化要比国外的难度更高。

在国内做数字阅读平台会遇到许多问题,比如图书的数据源就是其中之一。中国很多图书的数据源质量差到令人发指。我们曾有一本书,内容非常好,而且在我们平台上的销量也很可观。但是你要知道,我们很早之前就拿到这本书的数据,可它迟迟无法上架,就是因为出版社给我们数据源根本没有图,而这本书如果没有图,你基本很难看懂,其中有很多插图是非常珍贵的。于是我们就找出实体书,但它的印刷效果非常糟。我们想了各种各样办法,甚至是通过网络搜索插图,同时扫描截图,最后把这本书做了出来。类似例子非常多,现在出版社更多情况下给我们提供的都是PDF,然而PDF的质量对图书的数字化是远远不够。


数据源审查结果(点击可查看大图)

其实在中文图书世界里,想要让图书完全数字化,路还很长。这依赖于很多环节的共同努力,数据源只是其中之一,这也是制约着我们现在图书上架速度的一个环节。多看现在大约有12000本书,平均每个月有1000本书上架,能有这样的速度,其实非常不易。

CSDN:多看除了发布电子书以外,还作为许多科技媒体、纸媒发布电子杂志的平台,是什么促使你们开始与媒体合作推出杂志?

王毅:这与我们的用户属性有关。多看的用户大多是IT圈里的人,而且程序员居多,所以存在这样的需求。而且这些杂志基本上都可以免费下载,也的确很受欢迎。现在我们也在多更多的尝试,包括最近与知乎合作推出知乎周刊。

对于杂志,我们做了非常大的投入,你可以看到平台上的杂志,制作非常精美,不管是用小屏的手机,还是用Pad浏览,都是非常享受的一件事情。而且现在平台上还有很多优秀的杂志,比如《环球科学》、《科幻世界》、《人物》等。

现在杂志与图书有着相同的制作流程,不过在未来多看上的杂志还会有更多变化。因为杂志有很多独特的需求和特点,比如对订阅的需求,这是最大的不同之处。

CSDN:这一年,多看取得了哪些成绩?新一年将有怎样的计划?

王毅:成绩还谈不上,更多是一些数据的增长。我们现在实现全移动平台的覆盖,用户量超过了2200万。在小米手机的带动下,Android用户占多数。目前与多看书城合作的出版社已经超过了200家,截止至12月,多看已经发布了约12000册精品图书。我想这些都是就是目前所取得的成绩。


多看科技团队

至于计划,其实挺多的。对于我们来讲,内容方面肯定会进一步加强,引入更多的合作伙伴,使内容更为的丰富。在阅读体验方面,需要努力的地方也很多。尽管开发资源是有限的,但我们仍希望在未来的一年里,能让阅读体验更上一层楼,让更多人能够享受到比较好的数字阅读。

(责编/翟方庆)

本文为CSDN原创文章,未经允许不得转载,如需转载请联系market#csdn.net(#换成@)

------分隔线----------------------------
------分隔线----------------------------

最新技术推荐