一 AirPlay 接收端描述
AirPlay是苹果的私有协议,苹果官方未开放api和sdk,目前相对权威的一份非官方协议文档。这篇文档详细描述了aiplay 服务发现、图片、音视频、镜像投屏的相关协议,给我们开发airplay设备提供了很好的参考。但是不足之处是文档已经有6年多时间没有更新过,对于IOS的新变化可能没有完全同步。在开发过程中我们可能会面临一些未知的坑,需要针对具体问题来逐一解决。
1.1 Airplay服务发现
Airplay设备启动之后可以发布两类服务:
1.RAOP (Remote Audio Output Protocol),用于音频传输。
2.AirPlay service 用于图片、视频、镜像等媒体的传输。
实现AIRPLAY协议的APP不需要再做任何配置就能发现同一网络中的接收端设备,这主要得益于Bonjour(基于M-DNS协议实现)。Bonjour:苹果为基于组播域名服务(multicast DNS)的开放性Zeroconf标准所起的名字。Zeroconf (零设置网络标准):全称为Zero configuration networking,中文名则为零配置网络服务标准,是一种用于自动生成可用IP地址的网络技术,不需要额外的手动配置和专属的配置服务器。具体例子为:用户拥有一台apple tv和一台iPhone5s,只要都连入到同一个无线局域网内,iphone4s就会自动找出apple tv,那么在播放音乐或者视频时候,用户只要点击推送,就可以讲音乐和视频推送到apple tv上播放
对于接收端,我们主要关注RAOP服务:
RAOP service from Device Name
name: 5855CA1AE288@Device Name
type: _raop._tcp
port: 49152
txt:txtvers=1ch=2cn=0,1,2,3da=trueet=0,3,5md=0,1,2pw=falsesv=falsesr=44100ss=16tp=UDPvn=65537vs=130.14am=AppleTV2,1sf=0x4
服务名称由设备的mac地址和设备名称组成。
TXT属性包括:
name | value | description |
---|---|---|
txtvers | 1 | TXT记录版本 |
ch | 2 | 音频通道:立体声 |
cn | 0,1,2,3 | 音频编解码格式 |
et | 0,3,5 | 支持的加密类型 |
md | 0,1,2 | 支持的元数据类型 |
pw | false | 接收端是否需要密码 |
sr | 44100 | 音频码率 |
ss | 16 | 音频采样率 |
tp | UDP | 支持的传输层协议 |
vs | 130.14 | 服务端版本 |
am | AppleTV2,1 | 设备模式 |
音频编解码
cn | 描述 |
---|---|
0 | PCM |
1 | Apple Lossless (ALAC) |
2 | AAC |
3 | AAC ELD (Enhanced Low Delay) |
IOS设备作为AirPlay客户端,发送的音频流默认是ALAC格式,安卓设备作为接收端,系统自带的MediaPlayer无法解码ALAC格式,因此需要先使用开源的代码对ALAC格式的音频流进行解码,解码生成PCM数据,最后可以通过AudioTrack来播放PCM流。
加密类型
et | 描述 |
---|---|
0 | 没加密 |
1 | RSA (AirPort Express) |
3 | FairPlay |
4 | MFiSAP (3rd-party devices) |
5 | FairPlay SAPv2.5 |
元数据
md | 描述 |
---|---|
0 | text 文本 |
1 | artwork 插图 |
2 | progress 播放进度 |
总结:
通过RAOP服务发现协议中的描述,可以知道Airplay接收端服务的名称、支持的音频编解码格式、加密类型以及音频播放的进度、插入、歌曲和歌手名称等。这些可以满足我们使用IOS手机或者pad向安卓平台AirPlay接收端同步歌曲的基本需求。
二 音频流传输
音频流传输采用RTSP(Real Time Streaming Protocol)协议 (RFC 2326)。实时流传输协议,是TCP/IP协议体系中的一个应用层协议,由哥伦比亚大学、网景和RealNetworks公司提交的IETF RFC标准。
音频传输协议主要包括:RTSP请求、RTP流、音量控制、元数据、认证、远程控制。
2.1 RTSP请求
OPTIONS请求向RTSP服务端询问它支持的方法,以Apple TV为例,它支持:ANNOUNCE, SETUP, RECORD, PAUSE, FLUSH, TEARDOWN, OPTIONS, GET_PARAMETER, SET_PARAMETER, POST and GET.当客户端知道服务端支持的方法之后,便可以通过这些方法名向服务器发送数据来实现指定的功能。我们来详细看一下主要的方法描述:
ANNOUNCE
通过SDP(Session Description Protocol)服务描述协议向RTSP服务端发送音频流数据的属性,编解码器和加密密钥等信息。
RECORD
RECORD请求启动音频流传输
FLUSH
FLUSH请求停止音频流传输
TEARDOWN
结束RTSP会话
2.2 RTP流
音频包完全符合RTP协议。控制和定时分组并不完全符合RTP标准。
2.3 音量控制
通过SET_PARAMETER请求可以用来调节音量。音量值是float类型,-144表示静音,音量范围在-30到0之间。
示例
client → serverSET_PARAMETER rtsp://fe80::217:f2ff:fe0f:e0f6/3413821438 RTSP/1.0
CSeq: 6
Session: 1
Content-Type: text/parameters
Content-Length: 20
User-Agent: iTunes/10.6 (Macintosh; Intel Mac OS X 10.7.3) AppleWebKit/535.18.5
Client-Instance: 56B29BB6CB904862
DACP-ID: 56B29BB6CB904862
Active-Remote: 1986535575volume: -11.123877
server → clientRTSP/1.0 200 OK
Server: AirTunes/130.14
CSeq: 6
2.4 元数据
SET_PARAMETER请求可以用来传输元数据,元数据内容包括:音频名称、作者名字、专辑名称、插图、音频时长。RTP-Info 头部包含了rtptime参数,表示元数据的有效时间。
2.5 认证
发送的音频数据需要通过RSA认证,所有的二进制数据需要使用Base64 (RFC 4648) 进行加密。
客户端:
-
在ANNOUNCE 请求中,通过Apple-Challenge 发送128位随机数据。
-
生成一个128位的AES key,使用RSA公钥加密。
服务端:
-
使用RSA私钥解密AES key,AES key将被用来解密音频数据
-
使用RSA私钥对Apple-Challenge进行签名,通过Apple-Response头部发送返回结果给客户端
客户端:
使用RSA公钥对Apple-Response进行解密,检查数字与之前发送的数字是否相同。
2.6 远程控制
airplay服务端可以通过DACP (Digital Audio Control Protocol)协议向客户端发送命令:改变当前播放的音轨状态、暂停、重播,调整播放列表等。airplay客户端通过在RTSP请求中包含DACP-ID头文件来告诉服务端自己支持的命令范围。
总结:
airplay客户端通过向服务端发送OPTIONS请求获取服务端支持的方法列表,随后可以向服务端发送这些命令来建立和结束RTSP会话。客户端发送的音频数据需要RSA认证:首先客户端通过RSA公钥加密128位的AES key,然后服务端通过RSA私钥解密key,随后使用解密后的key来解密音频负荷数据包。客户端可以SET_PARAMETER 请求来调节音量,传输音轨名称、专辑名手、作者名称、音轨播放进度等信息。airplay服务端可以通过DACP发送远程控制命令来实现:改变当前播放的音轨状态、暂停、重播,调整播放列表等。
三 代码参考实现
AirReceiver(https://github.com/fgp/AirReceiver)使用Java写的运行在PC端的AirPlay接收端
DroidAirPlay(https://github.com/pentateu/DroidAirPlay) 基于AirReceiver代码转换成安卓项目的实现代码
AndroidAirPlayReceiver(https://github.com/zhhp1121/AndroidAirPlayReceiver)基于DroidAirPlay改造后能直接使用的安卓工程