Slimer软工课设日报-2016年7月2日

想给游戏添加丰富的背景音乐甚至音效，然而目前只能简单的利用playsound()函数播放一首音乐，虽说要同时播放音效的话可以调用多线程，但未免有些占内存，所以需要别的方法来实现音乐功能。

通过搜索，基本了解到了openAL、DirectSound、waveout等实现音频输出的方式，本文主要介绍DirectSound方法

本文记录DirectSound播放音频的技术。DirectSound是Windows下最常见的音频播放技术。目前大部分的音频播放应用都是通过DirectSound来播放的。本文记录一个使用DirectSound播放PCM的例子。
注：一位仁兄已经提醒我DirectSound已经计划被XAudio2取代了。后来考证了一下发现确有此事。因此在下次更新中考虑加入XAudio2播放PCM的例子。本文仍然记录一下DirectSound这位“元老”。

DirectSound简介

DirectSound是微软所开发DirectX的组件之一，可以在Windows 操作系统上录音，并且记录波形音效（waveform sound）。目前DirectSound 是一个成熟的API ，提供许多有用的功能，例如能够在较高的分辨率播放多声道声音。
DirectSound3D（DS3D）最早是1993年与 DirectX 3 一起发表的。DirectX 8以后的DirectSound和DirectSound3D的（DS3D）被合称DirectX Audio。

DirectSound有以下几种对象：

对象

数量

作用

主要接口

设备

每个应用程序只有一个设备对象

用来管理设备，创建辅助缓冲区

IDirectSound8

辅助缓冲区

每一个声音对应一个辅助缓冲区

用来管理一个静态的或者动态的声音流，然后在主缓冲区中混音

IDirectSoundBuffer8,

IDirectSound3DBuffer8,

IDirectSoundNotify8

主缓冲区

一个应用程序只有一个主缓冲区

将辅助缓冲区的数据进行混音，并且控制3D参数.

IDirectSoundBuffer,

IDirectSound3DListener8

DirectSound播放音频的流程

使用DirectSound播放音频一般情况下需要如下步骤：

1. 初始化

1) 创建一个IDirectSound8接口的对象
2) 设置协作级
3) 创建一个主缓冲对象
4) 创建一个副缓冲对象
5) 创建通知对象
6) 设置通知位置

7) 开始播放

2. 循环播放声音

1) 数据填充至副缓冲区

2) 等待播放完成

下面结合详细分析一下上文的流程。

1. 初始化
1) 创建一个IDirectSound8接口的对象
通过DirectSoundCreate8()方法可以创建一个设备对象。这个对象通常代表缺省的播放设备。DirectSoundCreate8()函数原型如下。
1 HRESULT DirectSoundCreate8(  
2      LPCGUID lpcGuidDevice,  
3      LPDIRECTSOUND8 * ppDS8,  
4      LPUNKNOWN pUnkOuter  
5 )  
参数的含义如下：
lpcGuidDevice：要创建的设备对象的GUID。可以指定为NULL，代表默认的播放设备。
ppDS8：返回的IDirectSound8对象的地址。
pUnkOuter：必须设为NULL。
例如如下代码即可创建一个IDirectSound8接口的对象
1 IDirectSound8 *m_pDS=NULL;    
2 DirectSoundCreate8(NULL,&m_pDS,NULL); 
2) 设置协作级
Windows 是一个多任务环境，同一时间有多个应用程序去访问设备。通过使用协作级别，DirectSound可以确保应用程序不会在别的设备使用时去访问，每个 DirectSound应用程序都有一个协作级别，这个级别决定着访问硬件的权限。
在创建一个设备对象以后，必须通过用IDirectSound8的SetCooperativeLevel()设置协作权限，否则将听不到声音。SetCooperativeLevel()的原型如下
1 HRESULT SetCooperativeLevel(  
2  HWND hwnd,  
3  DWORD dwLevel  
4 )  
参数的含义如下：
hwnd：应用程序窗口句柄。
dwLevel：支持以下几种级别。
DSSCL_EXCLUSIVE：与DSSCL_PRIORITY具有相同的作用。
DSSCL_NORMAL：正常的协调层级标志，其他程序可共享声卡设备进行播放。
DSSCL_PRIORITY：设置声卡设备为当前程序独占。
DSSCL_WRITEPRIMAR：可写主缓冲区，此时副缓冲区就不能进行播放处理，即不能将次缓冲区的数据送进混声器，再输出到主缓冲区上。这是最完全控制声音播放的方式。

3) 创建一个主缓冲对象
使用IDirectSound8的CreateSoundBuffer()可以创建一个IDirectSoundBuffer接口的主缓冲区对象。CreateSoundBuffer()的原型如下。
1 HRESULT CreateSoundBuffer(  
2  LPCDSBUFFERDESC pcDSBufferDesc,  
3  LPDIRECTSOUNDBUFFER * ppDSBuffer,  
4  LPUNKNOWN pUnkOuter  
5 ) 
参数的含义如下：
pcDSBufferDesc：描述声音缓冲的DSBUFFERDESC结构体的地址
ppDSBuffer：返回的IDirectSoundBuffer接口的对象的地址。
pUnkOuter：必须设置为NULL。
其中涉及到一个描述声音缓冲的结构体DSBUFFERDESC，该结构体的定义如下：
1 typedef struct _DSBUFFERDESC  
2 {  
3     DWORD           dwSize;  
4     DWORD           dwFlags;  
5     DWORD           dwBufferBytes;  
6     DWORD           dwReserved;  
7     LPWAVEFORMATEX  lpwfxFormat;  
8 } DSBUFFERDESC 
简单解释一下其中的变量的含义：
dwSize：结构体的大小。必须初始化该值。
dwFlags：设置声音缓存的属性。有很多选项，可以组合使用，就不一一列出了。详细的参数可以查看文档。
dwBufferBytes：缓冲的大小。
dwReserved：保留参数，暂时没有用。
lpwfxFormat：指向一个WAVE格式文件头的指针。
设置DSBUFFERDESC完毕后，就可以使用CreateSoundBuffer()创建主缓冲了。示例代码如下：
 1 DSBUFFERDESC dsbd;  
 2 memset(&dsbd,0,sizeof(dsbd));  
 3 dsbd.dwSize=sizeof(dsbd);  
 4 dsbd.dwFlags=DSBCAPS_GLOBALFOCUS | DSBCAPS_CTRLPOSITIONNOTIFY |DSBCAPS_GETCURRENTPOSITION2;  
 5 dsbd.dwBufferBytes=MAX_AUDIO_BUF*BUFFERNOTIFYSIZE;   
 6 //WAVE Header  
 7 dsbd.lpwfxFormat=(WAVEFORMATEX*)malloc(sizeof(WAVEFORMATEX));  
 8 dsbd.lpwfxFormat->wFormatTag=WAVE_FORMAT_PCM;     
 9 /* format type */  
10 (dsbd.lpwfxFormat)->nChannels=channels;            
11 /* number of channels (i.e. mono, stereo...) */  
12 (dsbd.lpwfxFormat)->nSamplesPerSec=sample_rate;       
13 /* sample rate */  
14 (dsbd.lpwfxFormat)->nAvgBytesPerSec=sample_rate*(bits_per_sample/8)*channels;   
15 /* for buffer estimation */  
16 (dsbd.lpwfxFormat)->nBlockAlign=(bits_per_sample/8)*channels;          
17 /* block size of data */  
18 (dsbd.lpwfxFormat)->wBitsPerSample=bits_per_sample;       
19 /* number of bits per sample of mono data */  
20 (dsbd.lpwfxFormat)->cbSize=0;  
21   
22   
23 //Creates a sound buffer object to manage audio samples.   
24 HRESULT hr1;  
25 if( FAILED(m_pDS->CreateSoundBuffer(&dsbd,&m_pDSBuffer,NULL))){     
26     return FALSE;  
27 } 
4) 创建一个副缓冲对象
使用IDirectSoundBuffer的QueryInterface()可以得到一个IDirectSoundBuffer8接口的对象。IDirectSoundBuffer8的GUID为IID_IDirectSoundBuffer8。示例代码如下。
1 IDirectSoundBuffer *m_pDSBuffer=NULL;  
2 IDirectSoundBuffer8 *m_pDSBuffer8=NULL;  
3 ...  
4 if( FAILED(m_pDSBuffer->QueryInterface(IID_IDirectSoundBuffer8,(LPVOID*)&m_pDSBuffer8))){  
5     return FALSE ;  
6 }  
5) 创建通知对象
使用IDirectSoundBuffer8的QueryInterface()可以得到一个IDirectSoundNotify8接口的对象。IDirectSoundBuffer8的GUID为IID_IDirectSoundNotify。示例代码如下。
IDirectSoundBuffer8 *m_pDSBuffer8=NULL;  
IDirectSoundNotify8 *m_pDSNotify=NULL;    
…  
if(FAILED(m_pDSBuffer8->QueryInterface(IID_IDirectSoundNotify,(LPVOID*)&m_pDSNotify))){  
    return FALSE ;  
} 
一句话概括一下通知对象的作用：当DirectSound缓冲区中的数据播放完毕后，告知系统应该填充新的数据。

6) 设置通知位置
使用IDirectSoundNotify8的SetNotificationPositions()可以设置通知的位置。SetNotificationPositions()的原型如下。
1 HRESULT SetNotificationPositions(  
2          DWORD dwPositionNotifies,  
3          LPCDSBPOSITIONNOTIFY pcPositionNotifies  
4 )  
参数含义如下。

dwPositionNotifies：DSBPOSITIONNOTIFY结构体的数量。既包含几个通知的位置。
pcPositionNotifies：指向DSBPOSITIONNOTIFY结构体数组的指针。
再这里涉及到一个结构体DSBPOSITIONNOTIFY，它描述了通知的位置。DSBPOSITIONNOTIFY的定义如下。
1 typedef struct DSBPOSITIONNOTIFY {  
2     DWORD dwOffset;  
3     HANDLE hEventNotify;  
4 } DSBPOSITIONNOTIFY; 
它的成员的含义如下。
dwOffset：通知事件触发的位置（距离缓冲开始位置的偏移量）。
hEventNotify：触发的事件的句柄。

7) 开始播放
使用IDirectSoundBuffer8的SetCurrentPosition ()可以设置播放的位置。SetCurrentPosition ()原型如下
1 HRESULT SetCurrentPosition(  
2          DWORD dwNewPosition  
3 )  
其中dwNewPosition是播放点与缓冲区首个字节之间的偏移量。
使用IDirectSoundBuffer8的Play ()可以开始播放音频数据。Play ()原型如下。
1 HRESULT Play(  
2          DWORD dwReserved1,  
3          DWORD dwPriority,  
4          DWORD dwFlags  
5 )  
参数含义：

dwReserved1：保留参数，必须取0。
dwPriority：优先级，一般情况下取0即可。
dwFlags：标志位。目前常见的是DSBPLAY_LOOPING。当播放至缓冲区结尾的时候，重新从缓冲区开始处开始播放。

2. 循环播放声音
1) 数据填充至副缓冲区
数据填充至副缓冲区之前，需要先使用Lock()锁定缓冲区。然后就可以使用fread()，memcpy()等方法将PCM音频采样数据填充至缓冲区。数据填充完毕后，使用Unlock()取消对缓冲区的锁定。
Lock()函数的原型如下。
1 HRESULT Lock(  
2          DWORD dwOffset,  
3          DWORD dwBytes,  
4          LPVOID * ppvAudioPtr1,  
5          LPDWORD  pdwAudioBytes1,  
6          LPVOID * ppvAudioPtr2,  
7          LPDWORD pdwAudioBytes2,  
8          DWORD dwFlags  
9 )  
参数的含义如下。
dwOffset：锁定的内存与缓冲区首地址之间的偏移量。
dwBytes：锁定的缓存的大小。
ppvAudioPtr1：获取到的指向缓存数据的指针。
pdwAudioBytes1：获取到的缓存数据的大小。
ppvAudioPtr2：没有用到，设置为NULL。
pdwAudioBytes2：没有用到，设置为0。
dwFlags：暂时没有研究。

UnLock()函数的原型如下。
1 HRESULT Unlock(  
2          LPVOID pvAudioPtr1,  
3          DWORD dwAudioBytes1,  
4          LPVOID pvAudioPtr2,  
5          DWORD dwAudioBytes2  
6 ) 
参数含义如下。
pvAudioPtr1：通过Lock()获取到的指向缓存数据的指针。
dwAudioBytes1：写入的数据量。
pvAudioPtr2：没有用到。

dwAudioBytes2：没有用到。

2) 等待播放完成

根据此前设置的通知机制，使用WaitForMultipleObjects()等待缓冲区中的数据播放完毕，然后进入下一个循环。

播放音频流程总结

DirectSound播放PCM音频数据的流程如下图所示。

其中涉及到的几个结构体之间的关系如下图所示。

转载自：http://www.cnblogs.com/lidabo/p/4160057.html

对象	数量	作用	主要接口
设备	每个应用程序只有一个设备对象	用来管理设备，创建辅助缓冲区	IDirectSound8
辅助缓冲区	每一个声音对应一个辅助缓冲区	用来管理一个静态的或者动态的声音流，然后在主缓冲区中混音	IDirectSoundBuffer8, IDirectSound3DBuffer8, IDirectSoundNotify8
主缓冲区	一个应用程序只有一个主缓冲区	将辅助缓冲区的数据进行混音，并且控制3D参数.	IDirectSoundBuffer, IDirectSound3DListener8