鸿蒙录音开发终极指南：从API到实战，搞定音频采集与格式解析

来自卡卡

740人浏览 · 2025-09-14 19:57:02

来自卡卡 · 2025-09-14 19:57:02 发布

引言：语音交互已成为鸿蒙生态的核心能力，本文将深入解析HarmonyOS录音功能的完整实现方案，涵盖API调用、格式选择、权限处理及实战技巧，助你快速集成语音能力！

一、鸿蒙录音核心API详解

鸿蒙通过 @ohos.multimedia.audio 模块提供专业级录音能力，核心类如下：

类名	作用	关键方法
AudioCapturer	音频采集引擎，控制录音流程	`start()`, `stop()`, `read()`, `release()`
AudioCapturerInfo	配置录音参数（采样率/声道/格式）	`sampleRate`, `channelCount`, `sampleFormat`, `encodingType`
AudioStreamInfo	定义音频流属性（与系统音频策略交互）	`samplingRate`, `channels`, `format`, `streamUsage`

二、录音全流程代码实战

步骤1：声明权限（必须！）

// module.json5 添加权限
"requestPermissions": [
  {
    "name": "ohos.permission.MICROPHONE"  // 麦克风权限
  }
]

步骤2：配置录音参数

import audio from '@ohos.multimedia.audio';

// 创建录音配置
const capturerInfo: audio.AudioCapturerInfo = {
  source: audio.SourceType.SOURCE_TYPE_MIC, // 音源类型（麦克风）
  capturerFlags: 0 // 默认标志位
};

const streamInfo: audio.AudioStreamInfo = {
  samplingRate: audio.AudioSamplingRate.SAMPLE_RATE_44100, // 44.1kHz采样率
  channels: audio.AudioChannel.CHANNEL_1,                 // 单声道
  sampleFormat: audio.AudioSampleFormat.SAMPLE_FORMAT_S16LE, // 16位小端格式
  encodingType: audio.AudioEncodingType.ENCODING_TYPE_RAW   // 原始PCM数据
};

// 创建录音实例
const audioCapturer = await audio.createAudioCapturer(capturerInfo, streamInfo);

步骤3：启动录音并保存文件

// 启动录音
await audioCapturer.start();

// 创建文件保存路径
const filePath = context.filesDir + '/record.pcm';

// 循环读取音频流并写入文件
while (isRecording) {
  const buffer = await audioCapturer.read(bufferSize); // 读取PCM数据
  fs.writeSync(filePath, buffer); // 写入原始PCM文件
}

// 停止录音并释放资源
audioCapturer.stop();
audioCapturer.release();

三、录音文件格式解析

鸿蒙录音默认输出 原始PCM数据，开发者需自主转换为通用格式：

格式	特点	转换方案
WAV	无损音质，含44字节文件头	在PCM数据前添加WAV文件头
AAC	有损压缩，体积小（适合网络传输）	使用`avcodec`库编码
MP3	通用性强	调用`lame`等三方库转换

格式选择指南：

语音识别场景 → 优先WAV（保证识别准确率）
网络传输场景 → 使用AAC（节省70%流量）
音乐录制场景 → 选择FLAC/WAV（保留高频细节）

四、进阶实战技巧

1. 实时音频处理

// 在read()后插入音频处理逻辑
const buffer = await audioCapturer.read();
const processedBuffer = noiseReduction(buffer); // 降噪处理
fs.writeSync(filePath, processedBuffer);

2. 分布式录音（鸿蒙独家能力）

// 调用附近手机的麦克风录音
const remoteDeviceId = '123456'; 
const capturer = await audio.createRemoteCapturer(remoteDeviceId, capturerInfo);

3. 录音状态监听

audioCapturer.on('stateChange', (state) => {
  if (state === audio.AudioState.STATE_RELEASED) {
    showToast('录音资源已释放');
  }
});

五、避坑指南

权限拒绝处理

try {
  await audioCapturer.start();
} catch (err) {
  if (err.code === 201) { // 权限未授予
    requestPermissions(); // 触发动态授权
  }
}

2.中断事件处理

// 来电时自动暂停录音
call.on('callStateChange', (state) => {
  if (state === 'ACTIVE') audioCapturer.pause();
});

3.文件写入优化

使用BufferPool减少IO操作
分块写入避免内存溢出

结语：录音能力扩展思路

语音转文字：对接华为ASR服务（@ohos.ai.asr）
声纹识别：提取PCM特征值生成声纹模型
实时翻译：录音流分段发送至翻译引擎

HarmonyOS开发者社区

讨论HarmonyOS开发技术，专注于API与组件、DevEco Studio、测试、元服务和应用上架分发等。

更多推荐

ArkTS 核心语法精讲：运算符、空安全与流程控制

HarmonyOS开发者社区

#基于HarmonyOS API 24实战解析投资理财记账应用深度技术解析,开闭原则（对扩展开放、对修改关闭）的实践，是构建可维护软件系统的黄金准则

在移动互联网与智能穿戴设备高度普及的今天，"习惯养成"已经从一个模糊的自我管理理念，演变为一个可量化、可追踪、可视化的数字化产品赛道。越来越多的人希望借助手中的智能终端，把"早起、冥想、阅读、运动"这些抽象的自律行为，转化为一条条清晰的数据曲线和一张张可触摸的打卡卡片。而鸿蒙生态（HarmonyOS）凭借其跨设备协同、分布式软总线以及声明式 UI 开发框架 ArkUI，为这类注重"轻量化交互 +