> Linux新闻 >

分布式流处理框架 Apache Samza 迎来 1.0 版本

Apache Samza 1.0 已发布,新版本为现有的工具库添加了各种功能,并对文档、代码片段、示例等进行了改进。Apache Samza 是一个分布式流处理框架,专用于实时数据的处理,目前已经在几个大公司实际生产中使用,如 LinkedIn、VMWare、Slack、Redfin 等。

更新亮点:

  • 高级 API 更稳定

  • Beam Runner 支持改进

  • Joining Streams and Tables(Table API 为开发人员提供了对本地和远程数据源的统一访问,同时提供了速率限制和缓存等功能)

  • 新增一个测试框架,允许使用内存中的输入和输出来测试 Samza 应用,无需再设置其他服务,如 Kafka、YARN 或 Zookeeper

  • 支持 Log4J2

  • Kafka 升级至 v0.11.1.62

  • SamzaSQL 现在提供一个 shell 来输入 SQL 查询

  • 支持 Side-inputs

  • 网站、文档和示例改进

更多细节可查阅发行说明:

https://blogs.apache.org/samza/entry/announcing-the-release-of-samza

下载地址:

https://dist.apache.org/repos/dist/release/samza/1.0.0/



(责任编辑:IT)