奇简Terark:数据压缩存储方面,我们超越了Facebook、Google | 创业

现在,人类已然进入了大数据年代。
依据 IDC 于 2012 年供给的数据,2011 年全球数据总量仅为 1.8ZB,估计到 2020 年,全球数据总量将涨至 35ZB。不过,IDC 其时的猜测好像仍是过分保存了,其现在最新的陈述现已将 2020 年全球数据总量猜测值进步到了44ZB(1ZB=1万亿GB)。
而数据量如此大幅度的增加将对 IT 职业带来极大的压力!
奇简 Terark 联合创始人郭宽介绍,在数据量越来越大的一同,用户对网络服务的体会要求也在不断进步,这就对企业的数据存储功率、服务响应速度都提出了越来越高的要求。尽管硬盘等存储介质在降价,但数据增加的速度更快,这将导致 IT 企业的归纳本钱继续上升。
已然找到了职业痛点,那就要测验解决问题。郭宽以为,职业急需“为企业节省很多存储本钱(也直接下降运维本钱)”的技能,所以,2015年末,他与另一个联合创始人雷鹏一同成立了这家专心于数据紧缩存储和数据检索的
奇简 Terark
。功能秒杀 Facebook、Google 同类产品
据了解,奇简研制了他们的杀手级产品——中心存储引擎 TerarkDB。从其对外发布的材料看,TerarkDB 的功能现已逾越Facebook、Google、Berkeley 的同类产品,不光占用空间更小,并且检索更快,紧缩率可到达同类产品的 5~10 倍,能为大数据运用进步 10 倍功能,一同本钱更是可以下降 50% 以上。
具体来说,800G 的 TPC-H 数据,运用 Terark 技能紧缩后仅为 47.9G。明显,TerarkDB 的诞生对大数据技能范畴具有极其重要的含义。
依据商场猜测,2020 年我国大数据的商场容量会逾越 8000 亿美元,到时将成为全球第一大数据中心,数据紧缩不单意味着本钱的节省,甚至或许成为约束其能否规模化开展、在剧烈竞赛中为最终用户供给优质服务的瓶颈。因而,郭宽以为未来我国甚至世界商场对数据紧缩技能有着刚性需求,而 Terark 正好处于迎候风口的极佳方位。
“咱们的技能中心优势是紧缩率和随机读功能,现在咱们在全球范围内还没有发现和咱们相似的算法。”郭宽表明,“当然,其他算法也在不断优化更新,咱们需求做的便是尽快让更多的生态接收咱们,从生态上构建壁垒。”据悉,在生态构建方面,
别的,郭宽还着重 TerarkDB 作为一个存储引擎,可以嵌入MongoDB、MySQL、SSDB等现有的存储系统中,也可以直接作为独立的存储系统进行运用。因而,其并不是传统存储系统的竞赛对手。
不行小觑的研制实力
其间,郭宽自己是前谷歌与百度的软件工程师。
在技能储备上面,
值得一提的是,正是由于
关于未来规划,郭宽表明他们将继续重视于商业存储引擎的研制,不断为更多产品供给底层引擎和算法的支撑,并在短期内不会触及上层运用。
而已然
的技能和查找引擎并无直接关系,但查找引擎的部分数据,可以存储在咱们的存储引擎上以取得更好的功能。“未来假如本钱足够,咱们不扫除切入一些可以充分发挥咱们优势的范畴,但短期内仍是专心于存储引擎和存储算法。”
据悉,2016年,Terark 取得了500万人民币的天使轮融资,由合力出资与道合本钱合投,且上一年已根本完成盈余。
相关阅览:
《A Chinese company is making the cloud 200x faster》
注:题图来自123RF