Android录音并且输出为Mp4文件的方法教程

前言

录音采用的是AudioRecord,通过MediaCodec进行编码,用MediaMuxer合成输出MP4文件。

1.

这里用AudioRecord来得到从麦克风录制的声音,AudiorRecord的用法还是比较简单的,首先初始化AudioRecord

fun prepare(file: File?, outputFormat: Int = MediaMuxer.OutputFormat.MUXER_OUTPUT_MPEG_4, audioSource: Int = MediaRecorder.AudioSource.MIC, sampleRateInHz: Int = 44100, channelConfig: Int = AudioFormat.CHANNEL_IN_STEREO, audioFormat: Int = AudioFormat.ENCODING_PCM_16BIT, bufferSizeInBytes: Int = AudioRecord.getMinBufferSize(sampleRateInHz, channelConfig, audioFormat))
{
 //初始化AudioRecord
 prepareAudioRecord(audioSource, sampleRateInHz, channelConfig, audioFormat, bufferSizeInBytes)
 //初始化输出文件
 prepareOutputFile(file)
 //初始化AudioEncoder
 prepareAudioEncoder(sampleRateInHz, outputFormat)
}


private fun prepareAudioRecord(audioSource: Int, sampleRateInHz: Int, channelConfig: Int, audioFormat: Int, bufferSizeInBytes: Int)
{
 minSize = AudioRecord.getMinBufferSize(sampleRateInHz, channelConfig, audioFormat)

 audioRecord = AudioRecord(audioSource, sampleRateInHz, channelConfig, audioFormat, bufferSizeInBytes)
}

AudioRecord的构造函数需要出入几个参数。

(1).

audioSource代表音频来源,这里传入MediaRecorder.AudioSource.MIC,代表音频来源于麦克风。

(2).

sampleRateInHz代表以赫兹表示的采样率,传入44100,这个数值可以保证所有设备都正常工作。

(3).

channelConfig代表声道配置,AudioFormat.CHANNEL_IN_STEREO代表传入立体声。

(4).

audioFormat代表音频数据将被返回的格式。传入AudioFormat.ENCODING_PCM_16BIT。

(5).

bufferSizeInBytes写入音频数据的缓冲区的总大小(以字节为单位)这里默认传入getMinBufferSize,这个方法返回成功创建AudioRecord实例所需的缓冲区大小的最小值。

开始录音时,启动一个线程

private val recordRunnable = Runnable {


 val data = ByteArray(minSize)
 //AudioRecord开始录音
 audioRecord?.startRecording()
 while (isRecording)
 {
  //将音频数据写入ByteArray
  audioRecord?.read(data, 0, data.size)
  audioEncoder.start()
  audioEncoder.drainEncoder(data)
 }
 audioEncoder.release()
 audioRecord?.stop()
 audioRecord?.release()
 audioRecord = null
}

这样就把音频数据写入一个bytearray,然后将数据传入AudioEncoder进行编码输出。

2.

AudioRecord得到的音频数据格式是pcm的,一般情况下无法bofang(可以通过AudioTrack播放),所以我们需要一次编码转换,这里用到的就是MediaCodec,MediaCodec这里我封装在AudioEncoder里。
我们首先要初始化MediaCodec:

private fun prepareAudioCodec(bitrate: Int, sampleRate: Int)
{
 bufferInfo = MediaCodec.BufferInfo()
 val mediaFormat = MediaFormat()
 mediaFormat.setInteger(MediaFormat.KEY_AAC_PROFILE, MediaCodecInfo.CodecProfileLevel.AACObjectLC)
 mediaFormat.setString(MediaFormat.KEY_MIME, MediaFormat.MIMETYPE_AUDIO_AAC)
 mediaFormat.setInteger(MediaFormat.KEY_BIT_RATE, bitrate)
 mediaFormat.setInteger(MediaFormat.KEY_CHANNEL_COUNT, 2)
 mediaFormat.setInteger(MediaFormat.KEY_SAMPLE_RATE, sampleRate)
 audioCodec = MediaCodec.createEncoderByType(MediaFormat.MIMETYPE_AUDIO_AAC)
 audioCodec.configure(mediaFormat, null, null, MediaCodec.CONFIGURE_FLAG_ENCODE)
}

这里需要创建一个MediaFormat,具体需要传入的参数大家可以参考开发者文档,需要注意的是音频和视频的MediaFormat设置的参数是不一样的,接着调用MediaCodec的configure,此时MediaCodec已经进入了configured的状态,可以开始进行编码了。

这里说到MediaCodec的状态,大家可以看来自开发者文档的MediaCodec的状态机图片。


看一下MediaCodec的工作过程:

可以将MediaCodec理解为传送带,将空的buffers传给audiorecord,audiorecord将得到的bytearray放入空的buffers,然后传入MediaCodec,mediaCodec编码后,传入MediaMuxer,MediaMuxer写入编码后的数据再讲buffers传给MediaCodec,MediaCodec清空使用过的Buffers,再传给AudioRecord。buffer是java nio库里的类,这里就不详述了,不清楚的请自行google。

调用configure后,我们就进入了configred状态,之后当audiorecord得到数据后,当MediaCodec调用start方法后,将ByteArray传入MediaCodec,进行编码:

 fun drainEncoder(data: ByteArray)
{

  val inIndex = audioCodec.dequeueInputBuffer(0)
  if (inIndex > 0)
  {
    val inBuffer = getInBuffer(inIndex)
    inBuffer.clear()
    inBuffer.put(data)
    if (!isEncoding)
    {
      audioCodec.queueInputBuffer(inIndex, 0, 0, System.nanoTime() / 1000, BUFFER_FLAG_END_OF_STREAM)

    } else
    {
      audioCodec.queueInputBuffer(inIndex, 0, data.size, System.nanoTime() / 1000, 0)
    }

  }

  do
  {
    val outIndex = audioCodec.dequeueOutputBuffer(bufferInfo, 0)
    when
    {
      outIndex > 0 ->
      {

        if (bufferInfo.size != 0)
        {
          val outBuffer = getOutBuffer(outIndex)
          outBuffer.position(bufferInfo.offset)
          outBuffer.limit(bufferInfo.offset + bufferInfo.size)
          mediaMuxer.writeSampleData(trackIndex, outBuffer, bufferInfo)
        }
        audioCodec.releaseOutputBuffer(outIndex, false)
      }
      outIndex == MediaCodec.INFO_OUTPUT_FORMAT_CHANGED ->
      {
        trackIndex = mediaMuxer.addTrack(audioCodec.outputFormat)
        mediaMuxer.start()
      }

    }
  } while (outIndex > 0)

  if (bufferInfo.flags and MediaCodec.BUFFER_FLAG_END_OF_STREAM != 0)
  {

    isEncoding = false
  }
}

这个方法就对应了MediaCodec对应的工作过程。

3.

MediaMuxer用来合成并输出音频,MediaMuxer用法还是比较简单的,这里就不详述了,需要注意的是,MediaMuxer只能合并一个音频轨道和一个视频轨道,还要注意的是要在addTrack调用之后再调用star方法。

最后附上项目地址

gitlab

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对呐喊教程的支持。

声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:notice#nhooo.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。