Posted in

Elasticsearch:分布式 RESTful 搜索引擎 | 开源日报 No.350_AI阅读总结 — 包阅AI

包阅导读总结

1. 搜索引擎、开源项目、模型框架、网络浏览器、BI 平台

2. 文本介绍了多个开源项目,包括分布式搜索引擎 Elasticsearch、多模态自回归模型 LWM、网络浏览器 Verso、文本生成框架 Lumina-T2X 和 BI 平台 supersonic,涉及功能、优势及相关技术等。

3.

– Elasticsearch

– 是免费开源的分布式 RESTful 搜索引擎

– 优化生产规模工作负载,支持多种功能

– LargeWorldModel/LWM

– 通用的大背景多模态自回归模型

– 通过 RingAttention 训练,能理解与生成语言、图像和视频

– versotile-org/verso

– 基于 Servo 网页引擎的网络浏览器

– 旨在改进用户体验,探索 Servo 潜力,支持多平台

– Alpha-VLLM/Lumina-T2X

– 文本到任意模态生成的统一框架

– 采用流匹配公式,配备多种先进技术

– tencentmusic/supersonic

– 下一代 BI 平台

– 集成 Chat BI 和 Headless BI 范式,解决自然语言转 SQL 等问题

思维导图:

文章地址:https://mp.weixin.qq.com/s/S-uY-RP7ei4reAxueBvsWQ

文章来源:mp.weixin.qq.com

作者:帅比柒

发布时间:2024/9/4 15:59

语言:中文

总字数:841字

预计阅读时间:4分钟

评分:89分

标签:开源项目,分布式系统,搜索引擎,多模态模型,浏览器开发


以下为原文内容

本内容来源于用户推荐转载,旨在分享知识与观点,如有侵权请联系删除 联系邮箱 media@ilingban.com

elastic/elasticsearchhttps://github.com/elastic/elasticsearch

Stars: 69.1k License: NOASSERTION

Elasticsearch 是一个免费且开源的分布式 RESTful 搜索引擎,旨在优化生产规模工作负载的速度和相关性。

通过 Elasticsearch,用户可以在大规模数据集上进行几乎实时的搜索,执行向量搜索,集成生成式 AI 应用程序等功能

LargeWorldModel/LWMhttps://github.com/LargeWorldModel/LWM

Stars: 7.1k License: Apache-2.0

picture

LWM 是一个通用的大背景多模态自回归模型。该项目通过 RingAttention 在大量不同长视频和书籍数据集上进行训练,能够执行语言、图像和视频的理解与生成。具体功能和优势包括:

  • 能够回答超过 1 小时 YouTube 视频的问题

安装要求简单,提供了一系列可用模型以及对应上下文大小和功能。

versotile-org/versohttps://github.com/versotile-org/verso

Stars: 4.1k License: Apache-2.0

picture

Verso 是一个基于 Servo 网页引擎构建的网络浏览器,旨在通过探索嵌入解决方案和多视图、多窗口支持来逐步发展成一个成熟的浏览器。这个项目的核心问题是尝试改进浏览器的用户体验并探索 Servo 的潜力。

  • 主要功能是基于 Servo 引擎构建的网页浏览器。
  • 目前提供了 Servoshell 以改善用户体验。
  • 支持 Windows、macOS、Linux 等平台的构建和运行。

Alpha-VLLM/Lumina-T2Xhttps://github.com/Alpha-VLLM/Lumina-T2X

Stars: 2.0k License: MIT

picture

Lumina-T2X 是一个统一的框架,用于将文本转换为任何形式的生成物。Lumina-T2X 是一个文本到任意模态生成的统一框架。

  • Flow-based Large Diffusion Transformer (Flag-DiT):采用流匹配公式,并配备了许多先进技术,如 RoPE、RMSNorm 和 KQ-norm。

tencentmusic/supersonichttps://github.com/tencentmusic/supersonic

Stars: 2.0k License: NOASSERTION

supersonic 是下一代 BI 平台,集成了由 LLM 提供动力的 Chat BI 和由语义层提供动力的 Headless BI 范式。该项目解决了将自然语言转换为 SQL 查询以及构建统一的语义数据模型两个方面的问题。

  • 内置 Chat BI 接口,让业务用户可以用自然语言进行查询
  • 内置 Headless BI 接口,让分析工程师构建语义数据模型
  • 内置基于规则的语义解析器来提高在某些场景下(如演示、集成测试)的效率

核心优势:

  • 整合 Chat BI 和 Headless BI 两种范式,增强 Text2SQL 生成能力。