"O" my god.........
ちょっと家でCellプログラミングの自習をしている
SIMD化もしたし
6SPEに投げているし
ダブルバッファリングもやったし、
ループもアンロールして中間的な値は普通の変数(通常はレジスタにマップさせるはず)した、、、
でも、理論値の100分の1にも満たないスピードしかでていない、、、
自分に自身を失いかけようとしていた矢先、ふと気づく。。
そういえばgccってデフォルトでは最適化するんだったっけ??
おもむろに-O2のオプションを追加して再コンパイル・・・
。。。さっきより10倍以上早くなる(笑)
とはいえ、まだまだ肩をなでおろすことはままならない、僕の計算が間違っていなければ理論値のまだまだ8分の一のスピードなのだから。。。
ちなみに今畳み込みのコードを書いているのだけれど、
理論値通りというか仮に153GFlops(6SPU×8Flops×3.2GHz)だせたとすると、サンプリング周波数48KHzでモノラルで約1分間の残響音を作り出せる計算になる。。。
FFT使わないでだよww
本当かな?自分の計算が間違っている気がしてきたw