Blame - jni/libopus/silk/enc_API.c - jami-client-android

silk_memcpy( &psEnc->state_Fxx[ 1 ].sCmn.resampler_state, &psEnc->state_Fxx[ 0 ].sCmn.resampler_state, sizeof(psEnc->state_Fxx[ 1 ].sCmn.resampler_state));

258

}

259

260

ret += silk_resampler( &psEnc->state_Fxx[ 0 ].sCmn.resampler_state,

261

&psEnc->state_Fxx[ 0 ].sCmn.inputBuf[ psEnc->state_Fxx[ 0 ].sCmn.inputBufIx + 2 ], buf, nSamplesFromInput );

262

psEnc->state_Fxx[ 0 ].sCmn.inputBufIx += nSamplesToBuffer;

263

264

nSamplesToBuffer = psEnc->state_Fxx[ 1 ].sCmn.frame_length - psEnc->state_Fxx[ 1 ].sCmn.inputBufIx;

265

nSamplesToBuffer = silk_min( nSamplesToBuffer, 10 * nBlocksOf10ms * psEnc->state_Fxx[ 1 ].sCmn.fs_kHz );

266

for( n = 0; n < nSamplesFromInput; n++ ) {

267

buf[ n ] = samplesIn[ 2 * n + 1 ];

268

}

269

ret += silk_resampler( &psEnc->state_Fxx[ 1 ].sCmn.resampler_state,

270

&psEnc->state_Fxx[ 1 ].sCmn.inputBuf[ psEnc->state_Fxx[ 1 ].sCmn.inputBufIx + 2 ], buf, nSamplesFromInput );

271

272

psEnc->state_Fxx[ 1 ].sCmn.inputBufIx += nSamplesToBuffer;

273

} else if( encControl->nChannelsAPI == 2 && encControl->nChannelsInternal == 1 ) {

274

/* Combine left and right channels before resampling */

275

for( n = 0; n < nSamplesFromInput; n++ ) {

276

sum = samplesIn[ 2 * n ] + samplesIn[ 2 * n + 1 ];

277

buf[ n ] = (opus_int16)silk_RSHIFT_ROUND( sum, 1 );

278

}

279

ret += silk_resampler( &psEnc->state_Fxx[ 0 ].sCmn.resampler_state,

280

&psEnc->state_Fxx[ 0 ].sCmn.inputBuf[ psEnc->state_Fxx[ 0 ].sCmn.inputBufIx + 2 ], buf, nSamplesFromInput );

281

/* On the first mono frame, average the results for the two resampler states */

282

if( psEnc->nPrevChannelsInternal == 2 && psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded == 0 ) {

283

ret += silk_resampler( &psEnc->state_Fxx[ 1 ].sCmn.resampler_state,

284

&psEnc->state_Fxx[ 1 ].sCmn.inputBuf[ psEnc->state_Fxx[ 1 ].sCmn.inputBufIx + 2 ], buf, nSamplesFromInput );

285

for( n = 0; n < psEnc->state_Fxx[ 0 ].sCmn.frame_length; n++ ) {

286

psEnc->state_Fxx[ 0 ].sCmn.inputBuf[ psEnc->state_Fxx[ 0 ].sCmn.inputBufIx+n+2 ] =

287

silk_RSHIFT(psEnc->state_Fxx[ 0 ].sCmn.inputBuf[ psEnc->state_Fxx[ 0 ].sCmn.inputBufIx+n+2 ]

288

+ psEnc->state_Fxx[ 1 ].sCmn.inputBuf[ psEnc->state_Fxx[ 1 ].sCmn.inputBufIx+n+2 ], 1);

289

}

290

}

291

psEnc->state_Fxx[ 0 ].sCmn.inputBufIx += nSamplesToBuffer;

292

} else {

293

silk_assert( encControl->nChannelsAPI == 1 && encControl->nChannelsInternal == 1 );

294

silk_memcpy(buf, samplesIn, nSamplesFromInput*sizeof(opus_int16));

295

ret += silk_resampler( &psEnc->state_Fxx[ 0 ].sCmn.resampler_state,

296

&psEnc->state_Fxx[ 0 ].sCmn.inputBuf[ psEnc->state_Fxx[ 0 ].sCmn.inputBufIx + 2 ], buf, nSamplesFromInput );

297

psEnc->state_Fxx[ 0 ].sCmn.inputBufIx += nSamplesToBuffer;

298

}

299

300

samplesIn += nSamplesFromInput * encControl->nChannelsAPI;

301

nSamplesIn -= nSamplesFromInput;

302

303

/* Default */

304

psEnc->allowBandwidthSwitch = 0;

305

306

/* Silk encoder */

307

if( psEnc->state_Fxx[ 0 ].sCmn.inputBufIx >= psEnc->state_Fxx[ 0 ].sCmn.frame_length ) {

308

/* Enough data in input buffer, so encode */

309

silk_assert( psEnc->state_Fxx[ 0 ].sCmn.inputBufIx == psEnc->state_Fxx[ 0 ].sCmn.frame_length );

310

silk_assert( encControl->nChannelsInternal == 1 || psEnc->state_Fxx[ 1 ].sCmn.inputBufIx == psEnc->state_Fxx[ 1 ].sCmn.frame_length );

311

312

/* Deal with LBRR data */

313

if( psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded == 0 && !prefillFlag ) {

314

/* Create space at start of payload for VAD and FEC flags */

315

opus_uint8 iCDF[ 2 ] = { 0, 0 };

316

iCDF[ 0 ] = 256 - silk_RSHIFT( 256, ( psEnc->state_Fxx[ 0 ].sCmn.nFramesPerPacket + 1 ) * encControl->nChannelsInternal );

317

ec_enc_icdf( psRangeEnc, 0, iCDF, 8 );

318

319

/* Encode any LBRR data from previous packet */

320

/* Encode LBRR flags */

321

for( n = 0; n < encControl->nChannelsInternal; n++ ) {

322

LBRR_symbol = 0;

323

for( i = 0; i < psEnc->state_Fxx[ n ].sCmn.nFramesPerPacket; i++ ) {

324

LBRR_symbol |= silk_LSHIFT( psEnc->state_Fxx[ n ].sCmn.LBRR_flags[ i ], i );

325

}

326

psEnc->state_Fxx[ n ].sCmn.LBRR_flag = LBRR_symbol > 0 ? 1 : 0;

327

if( LBRR_symbol && psEnc->state_Fxx[ n ].sCmn.nFramesPerPacket > 1 ) {

328

ec_enc_icdf( psRangeEnc, LBRR_symbol - 1, silk_LBRR_flags_iCDF_ptr[ psEnc->state_Fxx[ n ].sCmn.nFramesPerPacket - 2 ], 8 );

}

}

/* Code LBRR indices and excitation signals */

333

for( i = 0; i < psEnc->state_Fxx[ 0 ].sCmn.nFramesPerPacket; i++ ) {

334

for( n = 0; n < encControl->nChannelsInternal; n++ ) {

335

if( psEnc->state_Fxx[ n ].sCmn.LBRR_flags[ i ] ) {

336

opus_int condCoding;

337

338

if( encControl->nChannelsInternal == 2 && n == 0 ) {

339

silk_stereo_encode_pred( psRangeEnc, psEnc->sStereo.predIx[ i ] );

340

/* For LBRR data there's no need to code the mid-only flag if the side-channel LBRR flag is set */

341

if( psEnc->state_Fxx[ 1 ].sCmn.LBRR_flags[ i ] == 0 ) {

342

silk_stereo_encode_mid_only( psRangeEnc, psEnc->sStereo.mid_only_flags[ i ] );

343

}

344

}

345

/* Use conditional coding if previous frame available */

346

if( i > 0 && psEnc->state_Fxx[ n ].sCmn.LBRR_flags[ i - 1 ] ) {

347

condCoding = CODE_CONDITIONALLY;

348

} else {

349

condCoding = CODE_INDEPENDENTLY;

350

}

351

silk_encode_indices( &psEnc->state_Fxx[ n ].sCmn, psRangeEnc, i, 1, condCoding );

352

silk_encode_pulses( psRangeEnc, psEnc->state_Fxx[ n ].sCmn.indices_LBRR[i].signalType, psEnc->state_Fxx[ n ].sCmn.indices_LBRR[i].quantOffsetType,

353

psEnc->state_Fxx[ n ].sCmn.pulses_LBRR[ i ], psEnc->state_Fxx[ n ].sCmn.frame_length );

}

}

}

/* Reset LBRR flags */

359

for( n = 0; n < encControl->nChannelsInternal; n++ ) {

360

silk_memset( psEnc->state_Fxx[ n ].sCmn.LBRR_flags, 0, sizeof( psEnc->state_Fxx[ n ].sCmn.LBRR_flags ) );

}

}

silk_HP_variable_cutoff( psEnc->state_Fxx );

365

366

/* Total target bits for packet */

367

nBits = silk_DIV32_16( silk_MUL( encControl->bitRate, encControl->payloadSize_ms ), 1000 );

368

/* Subtract half of the bits already used */

369

if( !prefillFlag ) {

370

nBits -= ec_tell( psRangeEnc ) >> 1;

371

}

372

/* Divide by number of uncoded frames left in packet */

373

nBits = silk_DIV32_16( nBits, psEnc->state_Fxx[ 0 ].sCmn.nFramesPerPacket - psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded );

374

/* Convert to bits/second */

375

if( encControl->payloadSize_ms == 10 ) {

376

TargetRate_bps = silk_SMULBB( nBits, 100 );

377

} else {

378

TargetRate_bps = silk_SMULBB( nBits, 50 );

379

}

380

/* Subtract fraction of bits in excess of target in previous packets */

381

TargetRate_bps -= silk_DIV32_16( silk_MUL( psEnc->nBitsExceeded, 1000 ), BITRESERVOIR_DECAY_TIME_MS );

382

/* Never exceed input bitrate */

383

TargetRate_bps = silk_LIMIT( TargetRate_bps, encControl->bitRate, 5000 );

384

385

/* Convert Left/Right to Mid/Side */

386

if( encControl->nChannelsInternal == 2 ) {

387

silk_stereo_LR_to_MS( &psEnc->sStereo, &psEnc->state_Fxx[ 0 ].sCmn.inputBuf[ 2 ], &psEnc->state_Fxx[ 1 ].sCmn.inputBuf[ 2 ],

388

psEnc->sStereo.predIx[ psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded ], &psEnc->sStereo.mid_only_flags[ psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded ],

389

MStargetRates_bps, TargetRate_bps, psEnc->state_Fxx[ 0 ].sCmn.speech_activity_Q8, encControl->toMono,

390

psEnc->state_Fxx[ 0 ].sCmn.fs_kHz, psEnc->state_Fxx[ 0 ].sCmn.frame_length );

391

if( psEnc->sStereo.mid_only_flags[ psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded ] == 0 ) {

392

/* Reset side channel encoder memory for first frame with side coding */

393

if( psEnc->prev_decode_only_middle == 1 ) {

394

silk_memset( &psEnc->state_Fxx[ 1 ].sShape, 0, sizeof( psEnc->state_Fxx[ 1 ].sShape ) );

395

silk_memset( &psEnc->state_Fxx[ 1 ].sPrefilt, 0, sizeof( psEnc->state_Fxx[ 1 ].sPrefilt ) );

396

silk_memset( &psEnc->state_Fxx[ 1 ].sCmn.sNSQ, 0, sizeof( psEnc->state_Fxx[ 1 ].sCmn.sNSQ ) );

397

silk_memset( psEnc->state_Fxx[ 1 ].sCmn.prev_NLSFq_Q15, 0, sizeof( psEnc->state_Fxx[ 1 ].sCmn.prev_NLSFq_Q15 ) );

398

silk_memset( &psEnc->state_Fxx[ 1 ].sCmn.sLP.In_LP_State, 0, sizeof( psEnc->state_Fxx[ 1 ].sCmn.sLP.In_LP_State ) );

399

psEnc->state_Fxx[ 1 ].sCmn.prevLag = 100;

400

psEnc->state_Fxx[ 1 ].sCmn.sNSQ.lagPrev = 100;

401

psEnc->state_Fxx[ 1 ].sShape.LastGainIndex = 10;

402

psEnc->state_Fxx[ 1 ].sCmn.prevSignalType = TYPE_NO_VOICE_ACTIVITY;

403

psEnc->state_Fxx[ 1 ].sCmn.sNSQ.prev_gain_Q16 = 65536;

404

psEnc->state_Fxx[ 1 ].sCmn.first_frame_after_reset = 1;

405

}

406

silk_encode_do_VAD_Fxx( &psEnc->state_Fxx[ 1 ] );

407

} else {

408

psEnc->state_Fxx[ 1 ].sCmn.VAD_flags[ psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded ] = 0;

409

}

410

if( !prefillFlag ) {

411

silk_stereo_encode_pred( psRangeEnc, psEnc->sStereo.predIx[ psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded ] );

412

if( psEnc->state_Fxx[ 1 ].sCmn.VAD_flags[ psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded ] == 0 ) {

413

silk_stereo_encode_mid_only( psRangeEnc, psEnc->sStereo.mid_only_flags[ psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded ] );

}

}

} else {

/* Buffering */

silk_memcpy( psEnc->state_Fxx[ 0 ].sCmn.inputBuf, psEnc->sStereo.sMid, 2 * sizeof( opus_int16 ) );

419

silk_memcpy( psEnc->sStereo.sMid, &psEnc->state_Fxx[ 0 ].sCmn.inputBuf[ psEnc->state_Fxx[ 0 ].sCmn.frame_length ], 2 * sizeof( opus_int16 ) );

420

}

421

silk_encode_do_VAD_Fxx( &psEnc->state_Fxx[ 0 ] );

422

423

/* Encode */

424

for( n = 0; n < encControl->nChannelsInternal; n++ ) {

425

opus_int maxBits, useCBR;

426

427

/* Handling rate constraints */

428

maxBits = encControl->maxBits;

429

if( tot_blocks == 2 && curr_block == 0 ) {

430

maxBits = maxBits * 3 / 5;

431

} else if( tot_blocks == 3 ) {

432

if( curr_block == 0 ) {

433

maxBits = maxBits * 2 / 5;

434

} else if( curr_block == 1 ) {

435

maxBits = maxBits * 3 / 4;

436

}

437

}

438

useCBR = encControl->useCBR && curr_block == tot_blocks - 1;

439

440

if( encControl->nChannelsInternal == 1 ) {

441

channelRate_bps = TargetRate_bps;

442

} else {

443

channelRate_bps = MStargetRates_bps[ n ];

444

if( n == 0 && MStargetRates_bps[ 1 ] > 0 ) {

445

useCBR = 0;

446

/* Give mid up to 1/2 of the max bits for that frame */

447

maxBits -= encControl->maxBits / ( tot_blocks * 2 );

}

}

if( channelRate_bps > 0 ) {

452

opus_int condCoding;

453

454

silk_control_SNR( &psEnc->state_Fxx[ n ].sCmn, channelRate_bps );

455

456

/* Use independent coding if no previous frame available */

457

if( psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded - n <= 0 ) {

458

condCoding = CODE_INDEPENDENTLY;

459

} else if( n > 0 && psEnc->prev_decode_only_middle ) {

460

/* If we skipped a side frame in this packet, we don't

461

need LTP scaling; the LTP state is well-defined. */

462

condCoding = CODE_INDEPENDENTLY_NO_LTP_SCALING;

463

} else {

464

condCoding = CODE_CONDITIONALLY;

465

}

466

if( ( ret = silk_encode_frame_Fxx( &psEnc->state_Fxx[ n ], nBytesOut, psRangeEnc, condCoding, maxBits, useCBR ) ) != 0 ) {

silk_assert( 0 );

}

}

psEnc->state_Fxx[ n ].sCmn.controlled_since_last_payload = 0;

471

psEnc->state_Fxx[ n ].sCmn.inputBufIx = 0;

472

psEnc->state_Fxx[ n ].sCmn.nFramesEncoded++;

473

}

474

psEnc->prev_decode_only_middle = psEnc->sStereo.mid_only_flags[ psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded - 1 ];

475

476

/* Insert VAD and FEC flags at beginning of bitstream */

477

if( *nBytesOut > 0 && psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded == psEnc->state_Fxx[ 0 ].sCmn.nFramesPerPacket) {

478

flags = 0;

479

for( n = 0; n < encControl->nChannelsInternal; n++ ) {

480

for( i = 0; i < psEnc->state_Fxx[ n ].sCmn.nFramesPerPacket; i++ ) {

481

flags = silk_LSHIFT( flags, 1 );

482

flags |= psEnc->state_Fxx[ n ].sCmn.VAD_flags[ i ];

483

}

484

flags = silk_LSHIFT( flags, 1 );

485

flags |= psEnc->state_Fxx[ n ].sCmn.LBRR_flag;

486

}

487

if( !prefillFlag ) {

488

ec_enc_patch_initial_bits( psRangeEnc, flags, ( psEnc->state_Fxx[ 0 ].sCmn.nFramesPerPacket + 1 ) * encControl->nChannelsInternal );

489

}

490

491

/* Return zero bytes if all channels DTXed */

492

if( psEnc->state_Fxx[ 0 ].sCmn.inDTX && ( encControl->nChannelsInternal == 1 || psEnc->state_Fxx[ 1 ].sCmn.inDTX ) ) {

*nBytesOut = 0;

}

psEnc->nBitsExceeded += *nBytesOut * 8;

497

psEnc->nBitsExceeded -= silk_DIV32_16( silk_MUL( encControl->bitRate, encControl->payloadSize_ms ), 1000 );

498

psEnc->nBitsExceeded = silk_LIMIT( psEnc->nBitsExceeded, 0, 10000 );

499

500

/* Update flag indicating if bandwidth switching is allowed */

501

speech_act_thr_for_switch_Q8 = silk_SMLAWB( SILK_FIX_CONST( SPEECH_ACTIVITY_DTX_THRES, 8 ),

502

SILK_FIX_CONST( ( 1 - SPEECH_ACTIVITY_DTX_THRES ) / MAX_BANDWIDTH_SWITCH_DELAY_MS, 16 + 8 ), psEnc->timeSinceSwitchAllowed_ms );

503

if( psEnc->state_Fxx[ 0 ].sCmn.speech_activity_Q8 < speech_act_thr_for_switch_Q8 ) {

504

psEnc->allowBandwidthSwitch = 1;

505

psEnc->timeSinceSwitchAllowed_ms = 0;

506

} else {

507

psEnc->allowBandwidthSwitch = 0;

508

psEnc->timeSinceSwitchAllowed_ms += encControl->payloadSize_ms;

}

}

if( nSamplesIn == 0 ) {

break;

}

} else {

break;

}

curr_block++;

}

psEnc->nPrevChannelsInternal = encControl->nChannelsInternal;

522

523

encControl->allowBandwidthSwitch = psEnc->allowBandwidthSwitch;

524

encControl->inWBmodeWithoutVariableLP = psEnc->state_Fxx[ 0 ].sCmn.fs_kHz == 16 && psEnc->state_Fxx[ 0 ].sCmn.sLP.mode == 0;

525

encControl->internalSampleRate = silk_SMULBB( psEnc->state_Fxx[ 0 ].sCmn.fs_kHz, 1000 );

526

encControl->stereoWidth_Q14 = encControl->toMono ? 0 : psEnc->sStereo.smth_width_Q14;

527

if( prefillFlag ) {

528

encControl->payloadSize_ms = tmp_payloadSize_ms;

529

encControl->complexity = tmp_complexity;

530

for( n = 0; n < encControl->nChannelsInternal; n++ ) {

531

psEnc->state_Fxx[ n ].sCmn.controlled_since_last_payload = 0;

532

psEnc->state_Fxx[ n ].sCmn.prefillFlag = 0;

}

}

return ret;

}