vitalyinc
本站致力于IT相关技术的分享
为MLOps实时特征存储构建可观测性后端的数据模型选型:Cassandra vs. CockroachDB 为MLOps实时特征存储构建可观测性后端的数据模型选型:Cassandra vs. CockroachDB
我们的机器学习模型流水线在投产后面临的首要挑战,并非模型本身的精度,而是数据。具体来说,是生产环境实时特征的数据分布漂移(Data Drift)和模型预测的概念漂移(Concept Drift)。定位这些问题的根源需要一个能够处理海量、高基
2023-10-27
构建混合数据源的实时向量生成管道:整合TimescaleDB、JPA与Qdrant 构建混合数据源的实时向量生成管道:整合TimescaleDB、JPA与Qdrant
摆在面前的挑战很明确:为新一代的个性化推荐引擎构建一个核心组件——用户向量生成服务。业务要求这个服务必须能近乎实时地反应用户的最新行为,同时也要充分考虑用户的长期静态属性。单纯的每日批处理更新向量已经无法满足时效性要求,而仅依赖流式事件又会
2023-10-27