OceanBase开发者大会2024感受:OB不甘心只做分布式数据库
昨天我有幸受邀去上海参加了的OceanBase开发者2024度大会,作为观察团其一我也想谈谈我的个人理解,收获与感触颇丰,对于一个写了十几年技术博客的技术男,通过一篇描述性短文总结难度不亚于路遥当时写《平凡的世界》那段经典的开头。思来想去,我准备从“看见的”、“看不见的”、“瞬间的”和“永恒的”四个层面简短总结.
插曲:
提前一晚抵达上海已是晚上,谷雨刚过,南方似乎开启了雨季,落地时还在下着小雨,似乎命运似乎对我开了个小小的玩笑,落地时就感觉嗓子不舒服,又痛又痒几乎失声,上次这样记忆已经模糊,机场打车排着长队,刚好一朋友上海出差打着一辆宝马X5从远处过来接我一程,闲聊了一些国产库八卦,小聚完还去打烊的药店买了药,心想明天大会说不出话这如何是好,当时还打趣这可能是天意,暗示让我少说话吧,~_~!,心细这朋友第二天还又给我带盒特效药,一把药吞下去了会场。
看见的
1, 热闹的气氛
今年oceanbase专场现场依然火爆,过道人头涌动,主会场座无虚席,据说比去年规模还要大,表明了大家对OB关注热情,这正是一个产品欣欣向荣的关键,还有一些生态伙伴和招聘展位,在这偶遇了七、八年没见的小伙伴,已不是初出茅庐的小白。还有之前的领导还是那样年轻,看来钱没少挣, -_-。
2,技术创新
今年会场出现最多的关键字可能是一体化,做ALL-IN-ON的数据库,解决实际生产80%的数据问题,如在线离线一体化、向量关系型数据库一体化、数据处理与AI一体化、行存与列存多存储引擎并存一体化、AP和TP混合事务负载一体化,SQL引擎一体化、多模数据一体化、单机分布式一体化、云上云下多云部署一体化等。放眼全际主流的数据库,如Oracle也一致在超这个方向演进, 如何为开发提供友好的开发体验这应该是数据库的一项使命吧,长期以来,oracle数据库一直是集中式数据库的领导者,提供了数据的最大高可用,支撑的全球各行业的核心业务。然而从Google的Spanner发起的分布式SQL开始,出现了像CockroachDB、YugabyeDB国外分布式数据库也逐渐流行,而国产分布式中Oceanbase也是原生分布式数据库中为数不多的领军者。反而oracle 在23c才发布Oracle Globally Distributed Database成了一名分布式赛道追随者,肯定了分布式数据库在一些场景的优势。
Oceanbase是基于LSM-Tree架构所以在列存方面有更多的优势,引入行存、列存、行列混存增强了AP场景的适配性,不再局限于TP + 轻量化 AP 的版本定位,推出的列存向量化引擎,支持大宽表的处理,新增物化试图提升实时查询处理与处理, 并且现场与Clickhouse新版测试打分,已经处于同等水平。
支持TP flink AP两功能系统的实时同步,或同一系内不同副本间的行存与列存异构,或同库行列存储的转换,减少了过去以来ETL同步或多份数据带来的存储压力,同时OB4.3增加了物化视图日志,支持增量的快速刷新,这也正是同于Oracle用于分析的高级功能。
3,丰富的体验区
为了降低体验门槛也是诚意满满,在线可以免费申请云上的环境一个月的试用。
现场有多个展位有对于OB 安装部署,实时AP,多租户功能的介绍和演示,我也有驻足OB实时AP展位同”老鱼笔记“前辈本人,共同了解了OB在实时AP上的创新。同时OB还有给各开发者提供的动手实战体验区,亲自尝试OB带来的技术乐趣。
4, 热情的工作人员
这里也要再次感谢主办方的邀请, 尤其是几个工作人员小姐姐,会前的提醒,要么我本次行程可能要麻烦许多,采访沟通希望我嗓子的突然失声没有影响到。
5,优秀的小伙伴
除了上面提到偶遇多年未见的已成长独当一面,为老板排忧解难的小伙伴外, 还见到了一些偶像前辈、业界的大佬们、头一次碰面的数据库网友,还有当前活跃在数据库社区的后起之秀,请原谅我这个社恐没有一一问候, 因为我的嗓子,你再以为我是在”问“和”吼“.
看不见的
然而,“看不见的”,却是我在大会中最深刻的体会之一。在技术的背后,是无数个不为人知的艰辛与付出。每一个成功的产品背后,都有无数次的失败和尝试;每一次华丽的演讲,都离不开背后团队的辛勤付出。这些看不见的努力和付出,才是支撑着技术进步和创新的源泉,它们如同冰山一角,默默支撑着整个行业的发展。
比如为了更好的支持列存,不只是简单的增加列存储引擎,重构了列存数据格式和基于写存的代价模型,查询下压功能, SKIP INDEX, 优化新的估行公式算法提升评估准确性和查询性能。在多租户克隆方面得用LSM-TREE优势,不同于oracle的PDB CLONE, OB仅是元数据复制和新变更日志追加,同时保证隔离性,即使是在数据Merge的同时。
对于部分开发者反馈的问题之一”我们承认OB性能和扩展性很强,但是前提是你先成为OB专家的”的说法,其实不只是OB,相对于其它分布式数据库同样存在该问题,如果想用好分布式,前期需要一定的设计,才能真正最大化发挥分布式数据库特性, 对于安装配置方面,OB的做法是从内置几个固定的参数模板,减少对于数据库参数配置的疑惑。
除了以上在易用性上,还有诸多工具上的增强,如对于抖动、慢复杂问题的分析,对于错误日志的分析,OB表示去年成立了一个团队梳理时间模型,增强ASH视图功能,对于ORACLE DBA的小伙伴可能非常熟悉,ASH是分析某时间的性能问题绝对是必不可少的利器, 另外在安装部署上OBD工具的加持,和自带OCP工具白屏化的运维,还有OAS(OceanBase Autonomy Service)以数据库运行知识图谱为核心智能诊断产品,用于分布式数据库的异常发现和调优与根因发现,但是也可能存在一些不足, Gartner 顾总监开头有讲希望大家多给给分布式数据库一些包容和成长的机会。
最后就是对于社区的贡献,OB一直在在认真地做开源,并希望做真的开源,得到了开大开发者和客户的使用和认可,并持续提升了OceanBase的技术支持水平。
瞬间的
而“瞬间的”,则是那些在大会中的一瞬间,让我心生触动的时刻。
如开场一段有AI(70%)完成充满科技感的视频
OB首席科学家阳老师舍文求质通俗的语言,给我们分享数据库和云(资源共享与复用)优势发展趋势,做一架“大飞机式”式的数据库,应对互联网后时代的数据海量增长数据处理与分析并存的实际需求,及下一代数据库的理解。
陈教授展示了AI时代与数据库结合的思考与时间,现阶段向量数据库与大语言模型的结合,提供高质量的服务方式,带来数据库发展新趋势:在线离线一体化、向量与关系型数据库一体化、数据处理与AI计算一体化。想起了2020DTC 我当时准备的《Oracle自治数据库和自动化运维新特性与新进展》分享,Oracle Autonomous Database利用机器学习实现的自动驾驶能力,但是仅限Oracle公有云或与之联系的Exadata Cloud@Customer环境让国内用户无法体验,多希望国内数据也能早日实现以上能力。
Gartner 顾总监从一个国际研究机构的角度, 数据管理技术成熟度曲线看,目前的分布式数据库刚刚经过炒作巅峰,回归理性阶段,从基础环境、管理等角度存在一个“想当然”的误区,而这些问题都需要一个很长的周期去完善, 因此判断分布式数据库技术到成熟还有5-10年的时间。表示 云是分布式数据库最好的舞台。
白鳝老师提到的文档部分缺失的建议,我也非常认同,国产数据库目前因为知识的不公开,影响了大家学习的热情,也影响了生态的发展速度,不过目前在知识文档方面,OB在国产数据库列中文档算是丰富的,后期OB也表示会继续完善。
永恒的
在为开发者提供真正便利的同时,为用户提供安全可靠的服务,并秉持开放创新的态度,勇于从0到1的突破。我相信,这或许正是我们所追求的数据库的本质。就像我一直视为初恋的“ORACLE”一样,在考虑国产数据库时,我们也必须同时考虑其性价比,才能在激烈的竞争中立于不败之地。
技术不断进步,创新不断发展,知识也一直在更新。面对云数据库时代和人工智能技术的引入,作为数据库从业者,我们唯一不被淘汰的方法就是不断学习、不断进步,以跟上时代的步伐。正如“O 伯乐有话说”环节所展现的,即使没有吃上盖浇饭,也没有喝上白开水,但两位前辈一直是我学习的楷模。
最后,我也希望Oceanbase能够不断壮大,以上观点仅代表个人看法,如有错误,还请指正。我要去吃药了,保重~_`.
对不起,这篇文章暂时关闭评论。