Mac私塾---一个专注于大数据技术架构与应用分享的技术博客





几种常见的 Kafka 集群监控工具

Apache Kafka 是目前比较流行的分布式消息系统之一，其设计理念就是要保持高可用性和可扩展性。为了保证 Kafka 集群的稳定性和性能，需要监控各个组件的运行状态、异常情况和负载状况。下面介绍几种常见的 Kafka 集群监控工具。 ...

2023-04-16Kafka 阅读(4524)

置顶

DROP FUNCTION IF EXISTS myf1; CREATE FUNCTION myf1() RETURNS INT BEGIN DECLARE p INT DEFAULT 0; DECLARE c INT DEF...

2020-02-21MySQL 阅读(4473)

在使用Hive时，有时会遇到连接Hadoop分布式文件系统（HDFS）的端口错误。这种错误可能会导致Hive无法正常连接到HDFS，从而无法读取或写入数据。在本文中，将介绍如何解决这种连接HDFS端口错误的问题。首先，需要了解一下Hado...

2024-04-06Hadoop 阅读(2526)

Spark Streaming消费Kafka Direct方式数据零丢失实现近年来，随着大数据技术的迅猛发展，越来越多的企业开始重视数据处理。而Spark Streaming作为一款高效的流处理框架，在数据处理领域中扮演着至关重要的角色。...

2024-04-06Spark 阅读(1377)

Kafka是一个高吞吐量、分布式的消息系统。在Kafka中，每个主题(topic)可以被划分为多个分区(partition)，每个分区可以被复制(replica)到不同的broker节点上，以提高可靠性。 Kafka分区分配策略(Parti...

2024-04-06Kafka 阅读(1727)

Submarine是Apache Hadoop中的深度学习框架，可以让开发者在大数据平台上进行机器学习或深度学习的训练、推理等任务。它是Hadoop社区最新推出的项目，旨在解决深度学习任务在大数据平台中的难点，比如资源管理、数据共享等问题。...

2024-04-05Hadoop 阅读(1746)

注：以下为123智能机器人回答，仅供参考，禁止抄袭。 Spark机器学习之推荐引擎在众多机器学习算法中，推荐引擎是一个重要的应用场景。推荐引擎可以预测用户对商品或服务的偏好，并向用户推荐他们可能感兴趣的物品，这对于电子商务和在线媒体等领域...

2024-04-05Spark 阅读(2013)