SparkStreaming DStream输入源有哪些？-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

在SparkStreaming中，以下哪些数据可以作为DStream的输入源（）（多选）

A. socketSteam

B. kafkaSteam

C. flumeSteam

D. twitterSteam

上一题

下一题

题目解析

题目评论(0)

在Spark Streaming中，以下数据源可以作为DStream的输入源：

A: socketStream
B: kafkaStream
C: flumeStream
D: twitterStream

因此，正确答案是A、B、C、D。

专业分析：

1. **socketStream**: Spark Streaming支持通过TCP sockets接收实时数据流。使用`socketTextStream`方法，可以将一个指定主机和端口上的数据流作为DStream输入。

2. **kafkaStream**: Kafka是一个分布式消息队列系统，广泛用于实时数据流处理。Spark Streaming与Kafka集成良好，通过KafkaUtils可以直接从Kafka主题中读取数据并创建DStream。

3. **flumeStream**: Apache Flume是一个用于高效收集、聚合和移动大量日志数据的分布式服务。Spark Streaming可以通过FlumeUtils与Flume集成，从Flume中获取数据流。

4. **twitterStream**: Spark Streaming提供了与Twitter集成的支持，可以通过Twitter API获取实时推文流，并将其作为DStream输入。这通常需要使用TwitterUtils来设置Twitter的身份验证和流式数据接收。

综上所述，Spark Streaming支持多种数据源作为DStream输入，涵盖了从简单的socket到复杂的分布式消息系统的多种场景。