在6月23日阿里邮箱的产品发布会上,阿里邮箱产品负责人张紫徽说了这么一个段子:“我第一次向当时的老板提出要做邮箱时,我老板回答:‘做邮箱?我家的邮箱都长草了’。”
2009年,阿里邮箱团队成立,当时它的名字还是“阿里云邮”。七年之后,这个曾被认为会“长草”的邮箱产品以突破100万的企业用户数成为国内企业邮箱市场第一,完成超300次迭代,并且更名“阿里邮箱”完成升级。
佘智勇是邮箱团队中呆满整七年的技术专家,做邮箱产品的幕幕在他的记忆里仍然清晰。
2014年,为了满足越来越多企业用户提出的需求,阿里邮箱曾经历过一次大规模的数据库迁移,数据量涉及数P,数据库记录达数百亿条,这样大规模的数据迁移在当时的阿里巴巴都属罕见。为了平稳迁移,把对用户的影响降到最小,阿里邮箱对用户承诺只停服5分钟,5分钟后便可以正常使用。
佘智勇回忆,在约5个月的前期准备之后,邮箱团队进入了数据库迁移的攻坚战。每次数据搬运约需3天,3天后便进入数据校验环节,而为了实现对用户的承诺,团队必须在5分钟内完成数百亿条数据的校验工作。
“这就好比在给一架飞行中的飞机换引擎,如果处理不当就会坠毁。而在我们迁移数据的过程中,这架飞机坠毁了无数次。”佘智勇说,“很多次,到了最后几分钟,校验程序验证数据不对,如果要继续核查,我们的停服时间就会超出5分钟。为了不影响用户体验,每次我们都选择从头来过,再等3天。”
等3天,校验数据,数据不对,放弃从头来过,再等3天……这样的状态延续了整整两个月。
疲乏,是邮箱团队当时的状态,但是迁移数据库的工作还在继续。
“最后一次验证,验证工具报错,数百亿条数据中有2条数据不对。怎么办?在最后一分钟,团队中一位不停以人肉校对数据的同学突然发现,验证工具存在bug。千钧一发的时候,我们决定切新数据库,而事实证明,所有的数据的确都对了。”
类似的紧急情况还出现过无数次,而为了一个功能、一个图标,团队开会时拍桌走人的情况也不少见。
关于阿里邮箱未来的发展方向,佘智勇说:“邮箱最大的特点是跨平台、跨公司,阿里邮箱就是要发挥邮箱的这个特点,更加彻底地开放自己,让邮箱成为更高频的产品,连接更多,不止于邮箱。”(记者彭科峰)