5ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

■ このスレッドは過去ログ倉庫に格納されています

cellプログラミングしちゃいなよ4

1 :デフォルトの名無しさん:2009/01/25(日) 02:16:01
前スレ
cellプログラミングしちゃいなよ3
http://pc11.2ch.net/test/read.cgi/tech/1215388508/l50

2 :デフォルトの名無しさん:2009/01/25(日) 02:18:57
Cell Broadband Engine 技術情報公開
http://cell.scei.co.jp/

PLAYSTATION3 Linux Information Site
http://cell.fixstars.com/ps3linux/index.php

The Cell Processor - PukiWiki
http://cell.fixstars.com/pukiwiki/index.php

developerWorks : Cell Broadband Engine resource center(IBMのCell技術情報)
http://www-128.ibm.com/developerworks/power/cell/

Cell Broadband Engine Architecture forum (Cellプログラミングの掲示板)
http://www.ibm.com/developerworks/forums/dw_forum.jsp?forum=739&cat=46

Multicore Programming Primer: PS3 Cell Programming
(マサチューセッツ工科大学のPS3を使ったマルチコアプログラム演習。ソースコードなど有り)
http://cag.csail.mit.edu/ps3/

CellPerformance
http://www.cellperformance.com/articles/

3 :デフォルトの名無しさん:2009/01/27(火) 19:50:39
推奨NGNAME:●

4 :,,・´∀`・,,)っ-○◎●:2009/01/27(火) 20:09:32
8.5・・・だと?

5 :デフォルトの名無しさん:2009/01/27(火) 20:15:29
6.5だろ

6 :デフォルトの名無しさん:2009/01/27(火) 20:21:20
じゃあ、俺は 7.0 位でお願いします。

7 :,,・´∀`・,,)っ-○◎●:2009/01/27(火) 20:21:36
アナルアナル言うからハッテン後なんだよ


8 :202:2009/01/27(火) 20:48:42
すげーな、8.5とか。
普通に32bit整数型で、ビット順そのままの乱数を生成してるのかな?

9 :デフォルトの名無しさん:2009/01/27(火) 20:55:29
脳内レジスタにはちゃんと順番通りにならんでるんじゃん?w

10 :,,・´∀`・,,)っ-○◎●:2009/01/27(火) 23:33:11
中の人の反応見るになんか迷走してるようだな。出題ミスってレベルじゃね−ぞ。

11 :デフォルトの名無しさん:2009/01/27(火) 23:52:27
え、何を瞑想してるの?

12 :,,・´∀`・,,)っ-○◎●:2009/01/27(火) 23:57:29
条件が変わるかも知れない

13 :デフォルトの名無しさん:2009/01/28(水) 00:01:28
またですか?

14 :579:2009/01/28(水) 01:27:02
>>10
公式見解でないねw

本当はコンテスト後に「当社のリファレンスコードは〜」って
シュバッとする予定だったんじゃねえの?

インラインアセンブラも、最初はまずくねー?、大丈夫だろ?
って方針がコロコロ変わったと考えると滑稽。

今から課題の条件を変えるのはバカ丸出し。
出題ミスを認めるのがそれなりに王道。
リファレンスコードなかったことにするのが正解。


>>前スレ995
そう焦るなって。コンテ終わったら公開するよ。

最適化のベースになるようなアイディアを放出してみんなに
迷惑かける気は、今のところはない。

ついでに、SPU に特化した最適化は、(個人的には)興味ない。
だから intrinsics 使わないで優勝しようと画策していたわけだが、
自分でダメにしちゃったw


15 :579:2009/01/28(水) 01:39:10
>>前スレ997
>つか64ビット整数で処理したら速くならない?
速くなると思うよ。

が、uint64_t が portable かといえば(まだ・そんなに) portable じゃ
ないからね。

16 :579:2009/01/28(水) 01:48:48
アナル拡大体なわけだが。


17 :デフォルトの名無しさん:2009/01/28(水) 07:20:46
Fixstarsの返事はまだか
既に提出してる人が何人もいて今更変更できないとか

それはそうと団子って再利用性がどうとか実用性がこうとか言ってなかったっけ
結局乱数列の生成には何の役にもたたないコード書いてんのな
今更Cにこだわる必要も無いと思うんだけどどうだろう

18 :,,・´∀`・,,)っ-○◎●:2009/01/28(水) 07:23:53
俺は俺なりに俺が他のアーキテクチャに移植しやすいように書いてるつもりなんだけど
他って具体的にSSE4/AVXなんだけど

19 :,,・´∀`・,,)っ-○◎●:2009/01/28(水) 07:31:37
てか、上位入賞者用の参加賞ってさ、どうせ

YDL6.1(ノンサポート版)

だろ?別に要らないんだが。

20 :デフォルトの名無しさん:2009/01/28(水) 07:48:15
新しいアルゴリズムだと生成された乱数を毎回デコードすると元より遅くなるんだろ
実用性があるとすれば生成されたそのままのフォーマットで演算に利用できる場合位かな
この大会にしか使えないものの移植性なんて考えるだけばからしいと思うが

PS3持ってない奴がYDL6.1もらっても悲しくなるだけじゃないかw
Fixstarsのロゴが入った写真立てとか置物とかじゃないかと思ってるんだが

21 :,,・´∀`・,,)っ-○◎●:2009/01/28(水) 08:14:17
とりあえず速度さえ出ればなんでもいいってことになれば、
2つのソースを送って古いほうを公開してくださいって言うだろうね。

いちおうPowerPCのMacには使えるだろ?俺的にTigerで充分だけど。



22 :デフォルトの名無しさん:2009/01/28(水) 09:32:27
分かってないんだけど、579 のは大量に読み飛ばす場合なんかには高速になるんでしょ?
充分有用だし、却下されるべきではないと思うけど。

23 :202:2009/01/28(水) 09:55:53
>>22
有用であるかどうかが基準のコンテストではないからな。

「同じ乱数列を生成する」という課題に対して、579の解法はチェックサムしか計算してない。
チェックサムを元に「同じ乱数列を生成する」事ができるが、計測している時間は「同じ乱数列を
生成する」時間ではなくて「チェックサムを計算する」時間でしかない。
他の人は、フォーマットの変更のあり・なしの違いはあるものの、「同じ乱数列を生成」した上で
チェックサムの計算まで行って、時間を計っている。

ルールがフォーマット変更可・不可にかかわらず、579の回答は課題の趣旨と違なる。
だが、配布されている課題プログラムでは、チェックサムさえ合ってれば通ってしまう。

「mt_kadaiはチェックサムしかチェックしてないけど、同じ乱数生成しないでチェックサムだけ計算する
のはあり?」と質問したので、回答待ち。
回答が「同じ乱数列を生成しないとダメ」だった場合、「バイト単位・ビット単位の順番を入れ替える
変形はあり?それ以上の変形はあり?」と、質問しなおす予定。

24 :デフォルトの名無しさん:2009/01/28(水) 10:00:02
こういうコンテストに応募するのはこういう人種になることくらい容易に想像できるんだから、
きちっと詰めておかないのは甘過ぎると言わざるを得ないなぁ。

25 :デフォルトの名無しさん:2009/01/28(水) 10:01:33
出来るってことは重要だけど使う場面はなさそうだな
普通乱数の和が欲しかったら統計的な方法使ってもっとはしょるだろうし
厳密に計算した乱数の和が必要になることがあれば有用かも
もちろん今回は乱数の和だっただけでいろんな演算を同じ様に高速化出来るかもしれないけどね

それはそうと乱数を大量に読み飛ばす場面ってのが初期化以外で思いつかない
それに読み飛ばすだけなら普通の方法の方が高速なきがする

26 :デフォルトの名無しさん:2009/01/28(水) 14:18:12
>>23
まぁ fixstars の回答待ちは変らんけど、「チェックサムを計算する」だけなのはなしだけど、
「バイト単位・ビット単位の順番を入れ替える変形はあり?それ以上の変形はあり?」に
関してはありな気がする、っていうか、ありでいいと思うなぁ。疑似乱数列なんて、順番を
入れ替えても乱数性が変らない事が重要なんだから、実用上そう困る事はないだろうし…
あるとしたら、他の環境で再現したいときとかくらいでしょ。。。ってそれなりに大事かw

27 :デフォルトの名無しさん:2009/01/28(水) 14:51:29
順番変えたらfixstarsの検証が大変だろ
(疑似)乱数って明確な定義がないんだぜ

28 :デフォルトの名無しさん:2009/01/28(水) 14:55:14
計算した値をとりだすことはできるから再現性とかの問題は無い
値をとりだすのに計算以上の時間が必要なだけ
SUMなら値をとりださずに計算できるから高速化可能という話

29 :デフォルトの名無しさん:2009/01/28(水) 15:02:52
しかしFixstars反応無いな
審議中なのか事態に気がついていないのか
スルーされた場合どっちを提出しようかな

30 :202:2009/01/28(水) 15:05:41
中の人はちゃんとこのスレ見てるよw
回答はちょっと待っててってメール来た。

31 :デフォルトの名無しさん:2009/01/28(水) 16:06:01
締切まで期限切られてるのに回答を先延ばしするのは理不尽以外のなんでもない。
結局、方針がどうなるか次第なわけだが、ヤマカンで当て込んだ人が特をするんだろ?

回答もらえたときには既に締切まで時間が足りなかったりする可能性を考えて欲しい

32 :デフォルトの名無しさん:2009/01/28(水) 16:41:00
>>27
??どういう意味で言ってる?順番変えても擬似乱数としては等価でしょ?
順番いれかえて使ったら乱数性が弱くなるなんて擬似乱数としてダメダメだし。
まぁ、応募コードの検証って意味では fixstars は若干大変になると思うがw
「擬似乱数列は、メルセンヌ・ツイスタの実装と同じ乱数列を生成すること。
 ただし、メモリおよびレジスタ上の配置方法については言及しない」
でいい気がするんだけどなぁ。(課題のページ、"似乱数列"になってるw)

あと、前 688 にあった、
> hash = genrand_mine(num_rand) + genrand_mine(num_rand2);
みたいなのも、本質的ではないからなしにして明言して欲しいなぁ。

33 :デフォルトの名無しさん:2009/01/28(水) 17:55:09
>>14
>最適化のベースになるようなアイディアを放出してみんなに
>迷惑かける気は、今のところはない。
曝しちまえって。そうすればコンテ側もそれNGにするからさw
尤もハッタリだったら曝せないだろうけどなーwwww

34 :デフォルトの名無しさん:2009/01/28(水) 18:09:46
チェックサムのみの検証だってさ!
ショートカット万歳!!

35 :デフォルトの名無しさん:2009/01/28(水) 18:20:32
>>32
temperingする前の乱数列だって乱数の1表現なんだぜ?
その値から一意に求めるデータを取り出せるんだからな
tempering前の方が乱数的に弱いんだけどそれでもbit自由に入れ替えておkっていえる?

結局おkになったんだけど

36 :,,・´∀`・,,)っ-○◎●:2009/01/28(水) 18:21:23
Hack the Cell 2009 ご参加の皆様

この度は、Hack the Cell 2009にご参加いただき、
誠にありがとうございます。

Hack the Cell 2009の課題について、お詫びと訂正をさせていただきます。

皆様から課題の検証方法に関して多数のご質問がありました。
課題内容が不明瞭であったことを深くお詫び申し上げます。

「課題の検証方法に関しては、チェックサムの整合性でのみ判断いたします。」

課題 kadai1.tar.gz に含まれるcompare関数が乱数列のチェックサムを検証するもので
あったにも関わらず 「mt19937ar.cと同じ乱数列を生成してください」という定義のあい
まいな表記がありました。

課題内容の不完全性を深く反省するとともに、既に課題を提出した方々を配慮し、 現段
階での課題プログラムの変更はせずに、乱数列のチェックサムの整合性により検証を行
い、順位を決めることにさせて頂きます。

自由な発想での最適化を歓迎いたします。

また予想以上の盛り上がりに感謝し、「実用性に優れている」と弊社にて判断したプログ
ラムに対して「フィックスターズ賞」を追加することに決定しました。

「実用性に優れている」と判断する基準
* MT 乱数 (tempering された乱数) を生成している
* オリジナルコードと同じ順序で乱数を出力している
* MT 乱数を簡単に取り出せること (関数の戻り値, 配列に格納, など)
* 高速である
※上記の基準をもとに総合的に判断します。

37 :デフォルトの名無しさん:2009/01/28(水) 18:27:15
どう見ても出来レースの悪寒。

38 :,,・´∀`・,,)っ-○◎●:2009/01/28(水) 18:51:25
優勝よりフィックスターズ賞狙うほうが俺のポリシー的にアリだな。
へたに優勝狙って3位とかになるよりは歯切れもいい。

39 :デフォルトの名無しさん:2009/01/28(水) 18:54:07
>>38
それには同意
しかしフィクスタ賞は倍率高そうだな

40 :デフォルトの名無しさん:2009/01/28(水) 18:55:32
このスレは202と団子が反省し合うスレになりますた

41 :デフォルトの名無しさん:2009/01/28(水) 18:56:28
主催者的にはフィックスターズ賞が優勝なんだろうなぁ。

42 :デフォルトの名無しさん:2009/01/28(水) 19:05:57
>>41
フィックスターズ惨めだなおい。

43 :デフォルトの名無しさん:2009/01/28(水) 19:06:15
>>35
tempering 前の乱数列はメルセンヌ・ツイスタの実装と同じ乱数列ではないよ?
順番を入れ替える(配置を変える)のは等価だけど、演算(tempering)を変えたら
そら違う乱数列でしょ。乱数列の使い方を変えただけなら価値は変わらん。
(endian 変えて使おうが、bit flip して使おうが、証明された乱数性は変わらん)

って結局おkになったんだけどw

いやー、でも、こうなると 579 のが本当ならやる気なくなるなー orz

44 :デフォルトの名無しさん:2009/01/28(水) 19:06:47
ってか、フィックスターズ賞の賞品はなに?w

45 :デフォルトの名無しさん:2009/01/28(水) 19:08:45
> 「実用性に優れている」と判断する基準
> * MT 乱数 (tempering された乱数) を生成している
> * オリジナルコードと同じ順序で乱数を出力している
> * MT 乱数を簡単に取り出せること (関数の戻り値, 配列に格納, など)
> * 高速である

さて、フィクスターズの暖めてたもはんかいとうを探ろうかw

46 :デフォルトの名無しさん:2009/01/28(水) 19:17:40
>>44
YDL6.1(サポート版) とかwwww

47 :デフォルトの名無しさん:2009/01/28(水) 19:26:12
>>32
注意事項の "似乱数列" が訂正線引かれてるのに擬似乱数に修正されてるw
どんだけここチェックしてんすかw

48 :デフォルトの名無しさん:2009/01/28(水) 19:30:45
> 一回 genrand_mine() を呼び出す前には必ず一回以上 init_genrand_mine() が呼び出される
あ、これ明記されたのね。前 688 をやる必要はなくなったな。

49 :デフォルトの名無しさん:2009/01/28(水) 19:47:43
>>47
でも実質ここが一番活発なフォーラムじゃない?
良くも悪くも団子が参加したからだけど。

50 :デフォルトの名無しさん:2009/01/28(水) 20:21:22
真の優勝争いは O(1) 計数を持ってきた者どうしとなる。

51 :デフォルトの名無しさん:2009/01/28(水) 20:34:08
>>43
temperingって言ってしまうとbitの順番を入れ替えてるだけで情報的には等価なんだが

52 :デフォルトの名無しさん:2009/01/28(水) 20:38:02
xor って順番入れ替えなのか? ってか情報的に等価ってなに?

53 :デフォルトの名無しさん:2009/01/28(水) 20:45:38
> 予想以上の盛り上がり
爆笑した

54 :,,・´∀`・,,)っ-○◎●:2009/01/28(水) 20:48:46
>>49
俺「が」中の人にマークされてるよ。

55 :デフォルトの名無しさん:2009/01/28(水) 20:54:31
あんまり書くなとか言われたのか?w
ってか、こんだけ無用に情報垂れ流してれば、そりゃマークされるわなw

56 :デフォルトの名無しさん:2009/01/28(水) 21:14:43
>>53
すまん、>>51みたいに言うと語弊があったな
bit入れ替えも演算だしxorとも大差無いって事がいいたかった
情報的に等価ってのは表現が違うだけで1:1で対応してて同じ情報を持ってるって話
2進数とグレイコードとかね

57 :,,・´∀`・,,)っ-○◎●:2009/01/28(水) 21:19:41
ただのビット入れ替えだったらもっと演算量減らせたんだが、全ビットにうまいことXORかけあわせてあんのな

58 :デフォルトの名無しさん:2009/01/28(水) 21:44:45
>>56
前にも出たけど、tempering も線形写像だし、そりゃ情報量的には等価だよね。
俺が言いたかったのは、tempering 後の bit 入れ替えだったら乱数性に影響は
ないが、tempering(xor) を変更すると乱数性(均等分布)に影響がある、って事。
乱数性に影響ある変更加えたら乱数性の再検証が必要だけど、配置を変えた
だけなら、tempering 後の bit 入れ替え相当だから再検証は必要なしでしょ。

59 :,,・´∀`・,,)っ-○◎●:2009/01/28(水) 21:46:19
そこでTempering Functionの逆写像をだな

60 :デフォルトの名無しさん:2009/01/28(水) 21:47:19
そこで tempering を LUT でだな

61 :デフォルトの名無しさん:2009/01/28(水) 21:49:43
>>58
前提条件が大分違うな
上の方で出てたレイアウトが違うって話はそもそも1つの乱数を表すデータが連続した32bitに存在するとは限らないレベルだと思って話してた

62 :デフォルトの名無しさん:2009/01/28(水) 22:06:55
>>61
ん?前提は一緒だよ? > "1つの乱数を表すデータが連続した32bitに存在するとは限らない"
レイアウト変更してから演算するのと、演算後にレイアウト変更するのは等価ってだけだけど。

63 :,,・´∀`・,,)っ-○◎●:2009/01/28(水) 22:08:11
こだわんなよ。優勝狙うにはレイアウトや演算順序なんて気にしちゃだめだぞ

64 :227 ◆eZQcaIaFJs :2009/01/28(水) 22:15:25
transum組に勝てる気がしないので、今週末にレポートでっち上げて終了の予定。

前提条件が無茶苦茶だったとはいえ、ここ一ヶ月でかなりの知識を吸収できた
事には感謝しています。また来年も期待してますよー


65 :デフォルトの名無しさん:2009/01/28(水) 22:23:02
>>61
それはそうだけどそれが良くてtempering前に演算するのがだめってのが納得いかないって話
結局話題の最初に戻ってきてしまったけど

tempering前とtempering後で乱数としての性質が変わってる事も乱数の性質上bitを入れ替えても乱数だって事も分かってるさ
でも少なくとも必要な情報が連続しない場所に配置されてた場合にはそのまま利用することは出来ないだろ?
tempering前の数列のレイアウト変えた数列も求める乱数列とは異なってかつ一定の操作でその乱数列に出来るって意味では大して違いはないんじゃないかって言ってるんだ

66 :デフォルトの名無しさん:2009/01/28(水) 22:39:21
この一連の流れを読んで殆ど理解のレベルを超えてるが、

まぁ、Fixstarsが「ポーティングを最適化する」レベルのプログラマには
全く興味がないというのは理解したw。



67 :デフォルトの名無しさん:2009/01/28(水) 22:41:33
>>65
"大して違いはない" ってのは主観だから、そう思うならそれでいいんでないかい?

ただ、wikipedia にも書いてあるが、
> 「調律」は生成された乱数のワードのうち数ビットだけを取り出したときの高次元超
> 立方体への均等分布(vビット精度n次均等分布)を改良して理論値に近づけるための
> 工夫である(メルセンヌ・ツイスタは「調律」がなくても623次元超立方体に均等分布する)
という tempering とレイアウト変更を大した違いと認識しないのは俺には理解できないかな。

68 :,,・´∀`・,,)っ-○◎●:2009/01/28(水) 22:53:34
>>66
だろうな。さすが灯台陶工台の博士を採ってるだけはある。
Googleとか入社試験に難解な数式解かせるらしいし。

69 :デフォルトの名無しさん:2009/01/28(水) 23:05:31
それにしても
>「実用性に優れている」と弊社にて判断した
   ~~~~~~~~~~~~~~~~~~
とか
>※上記の基準をもとに総合的に判断します。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~

とかって何だろな?どういう重み付けをするかは主催者の
エゴでどうにでもできるという意味か?




70 :デフォルトの名無しさん:2009/01/28(水) 23:07:23
別に賞品出すわけじゃないから、良ければみんなにくれるんじゃん?w

71 :デフォルトの名無しさん:2009/01/28(水) 23:07:41
>>67
temperingに意味がないって思ってるわけじゃないぞ
ただ原因が何であれ取り出せない乱数に意味なんて無いだろうに

72 :,,・´∀`・,,)っ-○◎●:2009/01/28(水) 23:08:38
・だんごやさんであること

73 :デフォルトの名無しさん:2009/01/28(水) 23:12:19
>>65
> かつ一定の操作でその乱数列に出来る
レイアウト変更した乱数列は、"そのまま使ってもいい" って点が一番違う。

74 :デフォルトの名無しさん:2009/01/28(水) 23:15:32
・2ch で無用に暴露してないこと

75 :デフォルトの名無しさん:2009/01/28(水) 23:29:19
>>71
それもレイアウト次第じゃないか
さっき言った様に32bit連続で配置されない場合もあるし

76 :デフォルトの名無しさん:2009/01/28(水) 23:32:17
>>61
すまん、読み違えてたかも。
> 1つの乱数を表すデータが連続した32bitに存在するとは限らない
の1つって、1回に作る 32bit の事だと思ってたんだが違ったかも。

77 :デフォルトの名無しさん:2009/01/28(水) 23:33:52
>>75
ぬぉ、入れ違った。すまんかったっす。勘違いしてた。確かに、32bit 中に空きがある場合はだめっすな。

78 :デフォルトの名無しさん:2009/01/28(水) 23:35:56
なんか、アンカーめちゃくちゃ。これは何かの暗号化?w

79 :デフォルトの名無しさん:2009/01/28(水) 23:46:50
>>77
とりあえず納得してもらえてよかった
少しむきになってしまって恥ずかしい限り

それはそうと結局Fixstars賞狙うことにしたけど倍率が気になる

80 :デフォルトの名無しさん:2009/01/28(水) 23:47:29
実行環境について特に触れてないけど、65nm版やPowerXCellを前提に
ストール対策なしのコードを書いて、65nm版又はPowerXCellで実行して
下さいって書いたらそれで通るのかな?


81 :デフォルトの名無しさん:2009/01/28(水) 23:49:09
大丈夫。ここに書けば近いうちに 90nm で実行します、って追記されるw

82 :デフォルトの名無しさん:2009/01/28(水) 23:50:30
>>80
倍精度でも使うのか?

83 :,,・´∀`・,,)っ-○◎●:2009/01/28(水) 23:53:01
履歴書に書けるんじゃね?
ニートはとりあえず挑戦しとけ

84 :デフォルトの名無しさん:2009/01/29(木) 00:12:15
>>66
元々 579 的な解+Cell最適化を想定していたのだけど、
普通に高速化する人が多くて、そういう人達が気分を
害しそうだから賞を追加した、ってのが真相な気がしてる。
空気の読めるインテリw

85 :デフォルトの名無しさん:2009/01/29(木) 02:39:42
>>80
無限ストールバグがないだけで、ストール自体はある
無限ストールは普通ハマることはない

86 :デフォルトの名無しさん:2009/01/29(木) 02:57:26
>>84
をぃをぃ逆だろ
実用に使える高速なMTが欲しかった
>>579なんて想定してなかった
が真相

87 :デフォルトの名無しさん:2009/01/29(木) 03:41:11
しかし >>579 の書いてた事は理解出来んのー。
嘘混ざってるせいなのか、単に自分がアホなのか。
GF(2^33)で計数はいいけど、そもそも何を集計すると
tempering 的処理がループ外に追い出せるかが思いつかない。

88 :デフォルトの名無しさん:2009/01/29(木) 05:31:02
結局ハッタリって事なんじゃないの?なんかみんな揃って
引っ込みつかなくなってるようにしか見えないんだが…

89 :デフォルトの名無しさん:2009/01/29(木) 08:33:12
少なくとも、数学的チートの方法をこんなに大々的にばらされる事は
想定してなかっただろうなw

ここ見てる人たちが次々とチート方法で提出してきて慌てたに一票

90 :22:2009/01/29(木) 10:38:45
わかってないんだけど、
信号処理で、波形のままいじるか、周波数空間でいじって戻すか、の差みたいなもんでしょ?
アフィン変換の4x4行列(の回転成分)とクォータニオンみたいなもんなんでしょ?
受け入れられない人の理屈が分からない。

91 :デフォルトの名無しさん:2009/01/29(木) 10:53:04
技術的に受け入れてない奴なんていないとおもうけど
単に乱数列を生成って公式に書いてたから抵抗があっただけでしょ
今となっては公式見解も出たしなんの問題もない

92 :デフォルトの名無しさん:2009/01/29(木) 12:16:02
S = Temper(x1) ^ Temper(x2) ^ .... ^ Temper(xn)
 = Temper(x1 ^ x2 ^ ... ^ xn)
ならともかく、「+」で出来るってのが俄かには信じ難い。

93 :デフォルトの名無しさん:2009/01/29(木) 12:48:22
インラインアセンブラ使わないほうがフィクスタ賞に選ばれやすそうだな
もともと禁止だったし

94 :デフォルトの名無しさん:2009/01/29(木) 12:59:48
>>92
S = Mod32( GF33( temper(x1) ) * GF33( temper(x2) ) * ... * GF33( temper(xn) ) )
こうですか!?わかりません!教えてください!

95 :デフォルトの名無しさん:2009/01/29(木) 13:29:33
いままで触れられてきたどの戦略も、一長一短だなおい。

96 :デフォルトの名無しさん:2009/01/29(木) 13:41:37
>>93
なにその団子を入賞させるための賞

97 :デフォルトの名無しさん:2009/01/29(木) 17:14:06
質問です、cellのソフトウエアをcygwinでクロス開発仕様と思っています。
http://cellbe-cygwin.cvs.sourceforge.net/viewvc/cellbe-cygwin/
こちらのページのrpmを使って、spu-gccは無事インストールできました。
しかし、ppu-gccは
$ rpm -i ppu-gcc-4.1.1-5.cygwin.i686.rpm
error: Failed dependencies:
ppu-sysroot is needed by ppu-gcc-4.1.1-5
ppu-sysroot64 is needed by ppu-gcc-4.1.1-5
と出てしまい、インストールできません。
ppu-sysroot-f7-2.noarch.rpmを探しだし、インストールしようと思いましたが、
$ rpm -i ppu-sysroot-f7-2.noarch.rpm
warning: ppu-sysroot-f7-2.noarch.rpm: V3 DSA signature: NOKEY, key ID 77550217
package ppu-sysroot-f7-2 is intended for a linux operating system
とでてしまい、やっぱり駄目です。いったいどうすればクロス開発ができるようになるでしょうか。

98 :デフォルトの名無しさん:2009/01/29(木) 17:29:47
VMWareにでもLiunx入れたら?

99 :デフォルトの名無しさん:2009/01/29(木) 17:38:25
PS3 買えば?w ゲームも出来るよwww

100 :デフォルトの名無しさん:2009/01/29(木) 17:43:46
確かにな。クロス環境を自力で作れない奴が入賞できるわけないしw

101 :デフォルトの名無しさん:2009/01/29(木) 18:09:36
>>97は別にコンテストに出場しているとは言っていないと思うけど

102 :デフォルトの名無しさん:2009/01/29(木) 18:34:10
あ、ここってコンテストのスレじゃないんだっけw スマソ

103 : ◆iSaGiwaruI :2009/01/29(木) 22:13:25
遅ればせながらギリギリでエントリ。

104 :227 ◆eZQcaIaFJs :2009/01/29(木) 22:28:58
リアルで大事件が起こって困惑中。二ヶ月先すら見えない状況ですorz

>>90
2つの回転行列の補間をするのに、一度クオータニオンに戻して球状補間
するんじゃなく、行列同士を線形補完して直交させれれば終了、みたいな
ショートカットが出来るって事ですよね?

>>92
http://en.wikipedia.org/wiki/GF(2)
↑見てもさっぱり分からない罠。締め切り過ぎてからで良いんで、お勧めの
参考書とか有ったら教えてくださいな。


105 :デフォルトの名無しさん:2009/01/29(木) 23:47:39
>>104
細かい事に突っ込んで悪いけど、それじゃ結果変わっちゃうので
例えとしてはいまいち。
「行列の積じゃなくてクォータニオンの合成で処理して行列に戻す」
とかがショートカット。

106 :579:2009/01/30(金) 00:29:43
なんか席を外している間に fixstars はじまったな。
>>579ざまぁwみたいな展開を期待していたのだが。
コード公開するタイミング失ったではないか。

>>90
>>104
ニヤニヤ

>>33
>尤もハッタリだったら曝せないだろうけどなーwwww
もう少し上手く煽れよ。。。


107 :579:2009/01/30(金) 00:30:37
>>50 こうですね。わかります。
template<int s,int n,int p>struct M0;
template<int s,int n>struct MT{enum{N=M0<s,n,(n>>31)>::N};};
template<int s>struct M0<s,-624,-1>{enum{N=s};};
template<int s,int n>struct M0<s,n,-1>{enum{
P=M0<s,n-1,-1>::N,
N=(1812433253UL*(P^(P>>30))+n+624)&0xffffffffUL};
};
template<int s,int n>struct M0<s,n,0>{enum{
P=MT<s,n-624>::N&0x80000000UL,
Q=MT<s,n-623>::N&0x7fffffffUL,
R=MT<s,n-227>::N,
S=Q&1?0x9908b0dfUL:0UL,
N=R^((P|Q)>>1)^S};
};
template<int s,int n>struct T{enum{
P=MT<s,n>::N,
Q=P^(P>>11),
R=Q^(Q<<7)&0x9d2c5680UL,
S=R^(R<<15)&0xefc60000UL,
N=S^(S>>18)};
};
template<int s,int n>struct S;
template<int s>struct S<s,0>{enum{N=0};};
template<int s,int n>struct S{enum{
N=(unsigned)S<s,n-1>::N+(unsigned)T<s,n-1>::N&0xffffffffUL};
};


108 :227 ◆eZQcaIaFJs :2009/01/30(金) 00:41:47
>>105
チートしないと60fps出ない環境なんで、誤魔化せる所を探すのに必死です。
今日も境界判定のif文取ったり、エルミート補間を線形補間にしたりとかw

>>107
残念ながらC言語onlyな大会でございます。

http://ja.wikipedia.org/wiki/
%E3%83%86%E3%83%B3%E3%83%97%E3%83%AC%E3%83%BC%E3%83%88%E3%83%A1%E3%82%BF%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%9F%E3%83%B3%E3%82%B0


109 :,,・´∀`・,,)っ-●◎○:2009/01/30(金) 00:43:00
コンパイラが氏ぬwww

110 :,,・´∀`・,,)っ-●◎○:2009/01/30(金) 00:44:09
fixstarsはメタプログラミングって使わないんだろうか?
テンプレートによる再利用は俺も大好き


111 :579:2009/01/30(金) 00:46:35
>>86
つmc_rand_mt_u4

112 :,,・´∀`・,,)っ-●◎○:2009/01/30(金) 00:53:18
MTの本質は均等分布性にあるんであって数値の出る順番は本質じゃないと思うんだ
実際64ビット用MTは32ビット版と生成する値の互換をとってない。


113 :,,・´∀`・,,)っ-●◎○:2009/01/30(金) 00:57:18
んで、ビットの配置方法が違っても分布の均一性は変わらないわけで
極端な話トランザム(笑)でも再利用性があると思う

114 :デフォルトの名無しさん:2009/01/30(金) 02:20:33
まだ登録できたのか

115 :デフォルトの名無しさん:2009/01/30(金) 02:26:21
多分、団子はふぃっくすたーずの中の人から盛り上げるように頼まれてる。

116 :,,・´∀`・,,)っ-○◎●:2009/01/30(金) 04:19:00
中の人も一応は最新のIntelチップ相手だと分が悪いのは認識してるらしい。
(当たり前だ)

性能を引き出すことは、弱点を認識することから始まる。

117 :デフォルトの名無しさん:2009/01/30(金) 07:01:33
>性能を引き出すことは、弱点を認識することから始まる。
私の現場だと、最早「無駄な努力」と言われてしまう罠。

先日AMDの営業に話を聞いたのだけど、NVIDIAやIntelとの比較でしか性能を語れてないの。
ちょっと同情したw

118 :デフォルトの名無しさん:2009/01/30(金) 10:45:49
未だに13Cycleの壁と闘ってるんだがこのあたりってもうだれもおらんのか?
みんなこっちの道をあきらめてSUMを直接求める方向に行ってくれてるならそれはそれでいいんだけど
そっちの方向はいくら頑張っても数学に弱いやつは勝てなさそうなんで早々にあきらめてしまった

119 :デフォルトの名無しさん:2009/01/30(金) 11:52:50
>>118
比較的素直なSIMD実装でも頑張れば12切れる。

120 :デフォルトの名無しさん:2009/01/30(金) 11:57:47
>>119
まじで!
じゃあ本番は11台入ってからか
先は長いな

121 :デフォルトの名無しさん:2009/01/30(金) 13:00:17
項数爆発。こりゃだめだ・・・やり直し。

122 :デフォルトの名無しさん:2009/01/30(金) 15:15:37
お前ら楽しそうだな・・・
次があったら俺も参加したいぜ

123 :デフォルトの名無しさん:2009/01/30(金) 17:16:18
今からでも遅くはないZE!
応募だけしてみたら?

124 :デフォルトの名無しさん:2009/01/30(金) 20:30:44
私も参加賞狙いwで応募だけしてみました。

125 :デフォルトの名無しさん:2009/01/30(金) 23:25:04
>>103
そのトリすげぇなw

126 :デフォルトの名無しさん:2009/01/30(金) 23:33:48
トリップって狙って取れるもんなの?

127 :デフォルトの名無しさん:2009/01/30(金) 23:38:48
こら、そんなこと言うと五月蠅いのが飛んでくるぞ

128 :,,・´∀`・,,)っ-●◎○:2009/01/31(土) 00:28:48
ところで、優勝とフィクスタ賞を同時に狙う方法ってあるんじゃないの?


129 :,,・´∀`・,,)っ-●◎○:2009/01/31(土) 00:35:02
おっしゃ拡大体でトランザムktkr

130 :デフォルトの名無しさん:2009/01/31(土) 05:38:29
うわさをすればなんとやら

131 :デフォルトの名無しさん:2009/01/31(土) 06:01:15
あるかもしれんがそのトランザム次第じゃね
間違ってもO(1)で解ける様な話だとまず不可能だろ

132 :デフォルトの名無しさん:2009/01/31(土) 11:22:12
ところでフィクスタ賞って乱数がレジスタに現れるだけじゃだめなのか?
配列に格納・関数の戻り値など
などが何かはわからんがこれを見る限りじゃかなり厳格にやらないといけないかもしれんな
フィクスタ賞は規定を満たす中で一番高速なのが選ばれるってわけでもなさそうだし
配列に格納はまだしも関数の戻り値なんてやってたら大分コスト掛かりそうだ

133 :デフォルトの名無しさん:2009/01/31(土) 11:53:12
レジスタに現れるだけで実用性あるのかよ

134 :デフォルトの名無しさん:2009/01/31(土) 12:00:06
stqd入れるだけで出力可能って意味でかなり目標に近いとは思うが
そうじゃなきゃ完全にフィクスタ賞だけを狙うコードをつくらないといけないな

135 :デフォルトの名無しさん:2009/01/31(土) 13:22:36
実用的っていうのも中の人の主観で決まることだから、悩んでも無駄だろ。

そんなのよりも優勝目指そうぜw

136 :質問です:2009/01/31(土) 13:41:23
http://cell.fixstars.com/ps3linux/index.php/Cell_SDK_3.0%E3%82%92%E5%B0%8E%E5%85%A5%E3%81%99%E3%82%8B
この手順に習ってVirtualPCにインストールしたfedora9でCell SDK 3.0をインストールしたのですが、ppu-gccで
error:libspe2.h :No such file or directory が出てしまいます。
libspe2.hはいったいどこにあるのでしょうか・・・

137 :デフォルトの名無しさん:2009/01/31(土) 13:47:56
locate libspe2.h
してみれば

138 :質問です:2009/01/31(土) 13:59:32
/opt/cell/sysroot/usr/include/libspe2.h
と返ってきました。
標準のインクルードパスに加えるにはどうしたらいいのだろう・・・。

139 :デフォルトの名無しさん:2009/01/31(土) 14:31:31
試してないからだめかもしれないけど、環境変数 INCLUDEへのpathの追加とかは?

だめなら、とりあえずはコンパイル時のオプションで指定しとけば?

-I /opt/cell/sysroot/usr/include/

140 :デフォルトの名無しさん:2009/01/31(土) 14:52:12
>>135
優勝目指したいけど勝てる気がしないんだw
だって無茶な実装は3倍速なってるとか言う噂がが

141 :質問です:2009/01/31(土) 15:02:17
>>139
どうもありがとうございます。
単にMakefileの中身がppu-gccではなくgccになっていただけでした。
大変失礼しました

142 :デフォルトの名無しさん:2009/01/31(土) 15:17:23
団子のハッタリに惑わされているようじゃ参加賞止まり。

143 :,,・´∀`・,,)っ-○◎●:2009/01/31(土) 21:15:16
ハッタリだと認識してるようじゃ参加賞止まり

144 :デフォルトの名無しさん:2009/02/01(日) 01:37:52
だんごって学生部門に登録してるんだろ?
この中の何人が学生部門なんだろうな
意外と社会人より学生のほうが人数多いかもね

145 :,,・´∀`・,,)っ-○◎●:2009/02/01(日) 01:39:47
だれが学生部門じゃ

146 :デフォルトの名無しさん:2009/02/01(日) 02:47:16
前にそんなこと言ってなかったっけ

147 :デフォルトの名無しさん:2009/02/01(日) 07:06:43
>>146
デマだよ。デマゴーゴスだよ

このスレ自体がな

148 :デフォルトの名無しさん:2009/02/01(日) 10:28:39
コンテスト終了後なら、ソース見せてくれる?
純粋に興味がある。

149 :,,・´∀`・,,)っ-●◎○:2009/02/01(日) 11:14:53
ところでアセンブラ組はフィクスタ賞は諦めてるんだろ?
むしろ眼中にないんだろ?
ニヤニヤ

150 :デフォルトの名無しさん:2009/02/01(日) 11:55:57
いつぞやの693だけど俺はアセンブリ組
正直どうしたもんかね
俺も少し前に書き込んでた人間と同じくレジスタにだけ乱数が出現する状態だ
Even,Odd共に1サイクルの空きも無いから配列にはき出すコード埋めるだけでもオーバーヘッドがかかる
このままやってても優勝が難しい様ならフィクスタ賞向けのコードに書き換えなくちゃいかんのだが…
乱数のレイアウト変更した方もある程度の設計はしたものの思った程速くならない
プログラムとしては前者の方が気に入ってるから出来ればそっち出したいな

>>147
ゴマソースだよ。

151 :デフォルトの名無しさん:2009/02/01(日) 12:04:51
それはそうとだんごは学生部門じゃなかったんだな
それは非常に助かる

152 :デフォルトの名無しさん:2009/02/01(日) 12:20:18
今までの言動からすると、団子が本当のスタートラインに
立ててるかは疑わしいわけだがw

153 :デフォルトの名無しさん:2009/02/01(日) 12:34:19
>>152
フィクスタ賞できたから、遅くってもフィクスタ賞狙いだったって言い訳はできるなw
団子には是非優勝を狙ってると宣言して欲しいものだw

154 :デフォルトの名無しさん:2009/02/01(日) 12:56:00
再利用性にこだわってたからフィクスタ賞狙いでも別にいいけどね
フィクスタ賞とりつつ優勝者を上回るコードを締切と同時に公開したらかこいい

155 :,,・´∀`・,,)っ-○◎●:2009/02/02(月) 06:20:26
10パターンくらい用意しててどれにするか迷ってる状態。

>>152
そう思わないとつらいことでもあるんですか?(笑)

156 :デフォルトの名無しさん:2009/02/02(月) 06:25:31
10パターンってw
一番速いのか一番実用的なの
一番アルゴリズムが綺麗なの
3つ位しか選ぶ基準が思い浮かばねえ

157 :,,・´∀`・,,)っ-●◎○:2009/02/02(月) 06:50:49
何度も言ってるが出力が互換であることは実用性とはまったく関係ない。


158 :デフォルトの名無しさん:2009/02/02(月) 08:09:45
ならなおさら10パターンも思い浮かばないな
一番速いの選べばおk

159 :デフォルトの名無しさん:2009/02/02(月) 09:00:29
そこそこの性能を出しつつネタに走るとか

160 :デフォルトの名無しさん:2009/02/02(月) 09:39:19
>>157
デコードに何十種類もかかるフォーマットじゃなければな

161 :デフォルトの名無しさん:2009/02/02(月) 09:40:36
何十種類→何十サイクル
一体どんな残念な事が頭の中に起こってこの単語が出てきたんだ…

162 :デフォルトの名無しさん:2009/02/02(月) 09:57:59
IOCCCばりのネタプログラムを希望する


163 :デフォルトの名無しさん:2009/02/02(月) 10:02:10
>>160-161
ビット配列がどうなっていようと乱数は乱数なんだぜ。
たとえば公式のMTの64bit専用版は32ビットと生成式が違う
ビットの配列構造が違ってても乱数は乱数なんだ。

たとえば、32ビット乱数32個を行列転置したら乱数じゃなくなるのか?


164 :デフォルトの名無しさん:2009/02/02(月) 10:21:53
多分レイアウト変更組がやってることってのはそれだよね
みんな薄々気づいてただろうけど結局こうなったな
確かに転置したところで乱数であることには変わりはないね
で、それを読みだすのに何サイクルかかる?って話だよ
それとも0bit目を32個集めてそれも乱数って言ってる?

165 :202:2009/02/02(月) 10:26:06
>>164
MTの場合、それでも乱数といえそうな気がする。
bit単位のランダム性が特徴のひとつだから、ビットを特定の順序に並べ替えるだけなら
ランダム性が崩れない。

166 :デフォルトの名無しさん:2009/02/02(月) 10:30:33
>>164
ん?0ビット目を32個集めても乱数として使えるだろ?
同じサマリになるようにしろってのはフィックスターズの都合であって
現実にモンテカルロなどに使う場合はビット単位でのランダム性を破壊するような改変でない限り
十分実用的といえる。

167 :デフォルトの名無しさん:2009/02/02(月) 10:54:57
そうか
理解不足で混乱させてすまん
って事はフィクスタ賞も危ういなぁ
純粋な互換で勝負するのは無理があるか

168 :,,・´∀`・,,)っ-○◎●:2009/02/03(火) 03:45:54
herumi氏が苦戦してるの見ると小気味良いな

169 :デフォルトの名無しさん:2009/02/03(火) 04:00:52
>>129
あ り え な い 。それは。
GF2^33で tempering 処理を80%近くまで外部化してやらないと、そのトランザムは出来ない。
仮にビット単位の数え上げをMacWilliams恒等式で集中計算しても、ハミング距離が使えないその段階では
mod2^32 変換行列が手に入れられないはず。 妄 想 で つ か ?
とりあえず SIMD でループを大量にアンロールして合計値にどんどん足していけ。
アセンブラならABIに従ってレジスタ値取っておくのを忘れんなよ。説教くさくなってスマソ・・・。ついな・・・。

170 :,,・´∀`・,,)っ-○◎●:2009/02/03(火) 04:14:25
キョッキョッキョッキョッキョ

171 :デフォルトの名無しさん:2009/02/03(火) 04:29:05
スレ違いだったらごめんなさい。。
きく人がいなくてここに辿り着きました。

for ( i = iv->dim; i < new_dim; i++ )
iv->ive[i] = 0;

こんな感じの構造体のループって普通にSIMD化できるんですか?
構造体とかよく分からなくて…汗。



172 :デフォルトの名無しさん:2009/02/03(火) 04:30:51
それと、


register int i;
for ( i = 0; i < len; i++ )
out[i] = s*dp[i];

上の様なコードをSIMD化したかったら、

vector float *out_v, *dp_v;
for(i = 0; i< len/4; i++){
out_v[i] = vec_misaligned_load(*(out + i*4));
dp_v[i] = vec_misaligned_load(*(dp + i*4));
out_[i] = spu_mul(spu_splats(s), dp_v[i]);
vec_misaligned_store(out_v[i], *(out + i*4));
}
for(i = 4*(len/4); i < len; i++){
out[i] = s*dp[i];
}

こんな風にするしかないんですか?
outとdpは引数で、16バイトにアラインメントされてるか分からなかったので、この方法しか思いつかなかったのですが、何かこれじゃ余計遅くなるような気がして;;


173 :デフォルトの名無しさん:2009/02/03(火) 04:36:49
最後に、
for ( i = 0; i < px_size; i++ )
px_pe[i] = i;
がSIMD化可能とコンパイラに言われたのですが、適切なintrinsicsが思い浮かびません。どうSIMD化できるのでしょうか?

あと、signed int **a __attribute((aligned(16)));
と宣言したら、**a, **(a+4), **(a+8),...が16バイトにアラインメントされてることになりますか?

長くて&初歩的な質問ばかりですみません。
よろしくお願いします。

174 :,,・´∀`・,,)っ-○◎●:2009/02/03(火) 04:48:10
なんだそのやる気のない記法は。
outとdpのアドレスを16バイト境界にあわせられない理由がある?

最悪ストアだけでいいから16バイト境界にあわせること。
合わない部分はループの外に吐き出してOK。

175 :,,・´∀`・,,)っ-○◎●:2009/02/03(火) 05:01:17
16バイトにアラインメントされてるかを検定する方法を知らないとか言わないよな?

>outとdpは引数で、16バイトにアラインメントされてるか分からなかったので、
>この方法しか思いつかなかったのですが、何かこれじゃ余計遅くなるような気がして;;

判定方法が解らないとか言わないでくれよ?
ループ回数が十分大きければ、ループの外側での条件分岐はトータルの計算時間に大した影響は無い。

(address + 15) & ~15 などとして、16バイト境界を検出する。
んで、16バイト境界に合った区間だけのSIMD化を検討しる。



>>173
ならねぇwww
そもそもaの指す実体は何だよ
そいつがアラインメントされてるかどうか次第だ

176 :デフォルトの名無しさん:2009/02/03(火) 05:06:15
>174さん

あ、すみません。少なくともoutは代入されるだけなので16バイトにアラインメントしても問題ないですね。

dpの方が理解できないのですが、引数として貰ってくるものなので…いつアラインメントすればいいのでしょうか?
宣言された後で、dp __attribute__((aligned(16)))って書けば行列の中身も全部グッと(?)移動するものなんですか?

よろしくお願いします。

177 :デフォルトの名無しさん:2009/02/03(火) 05:13:45
>175さん
同時にアップしてたみたいです;;前の質問消しておきます。

なるほど!そうやってSIMD化するんですね!コード書きなおしてみます…。
どうもありがとうございます。

aの指す実体…。う〜ん、実はポインタ一週間前に覚えたばかりなんです。汗
ちょっと考えてからまた質問させていただきます。
ありがとうございます。

178 :,,・´∀`・,,)っ-○◎●:2009/02/03(火) 05:16:14
言ってる意味がわからん。
dpの配列の実体はダレが決めるの?君以外が決めるの?
君が自由に決めることができるなら、その配列に、alignオプションを指定しておきなさい。
自由にならないのなら、交渉しなさい。

駄目なら、そこではじめてミスアラインロードを検討すればいい。
__attribute__((aligned(16)))という指定は、配列の定義を指定された通りにデータを配置されるというもので
元々あるデータ配置を移動するものではない。

ポインタにalignやってもポインタ型が16バイト境界に配置されるだけで
実体は実体の定義通りに配置される。

179 :,,・´∀`・,,)っ-○◎●:2009/02/03(火) 05:17:08
ポインタ理解してないのにSIMDとか無茶ですから

180 :デフォルトの名無しさん:2009/02/03(火) 05:31:20
なんだかんだ言って親切だな。


181 :デフォルトの名無しさん:2009/02/03(火) 05:34:33
ありがとうございます。
meschachというライブラリの中のループをSIMD化しているところなんです。プログラム自体をあまり理解してなくて。。

あと、また質問なのですが、SPEプログラムで実行時間を測りたい場合って、SPU Decrementerでprof.star()とかやるしかないですか?
これってCELLシミュレーター上でしか使えないですよね?
#include <time.h>でclock()とか使ってみたんですけど(ps3上で)、エラー出たので、サポートされていないのかなと。

よろしくお願いします。

182 :,,・´∀`・,,)っ-○◎● :2009/02/03(火) 05:38:35
time.hは使えない。

SPU DecrementerはPS3やSpursEngine上のSPU実機でもつかえる。



183 :,,・´∀`・,,)っ-○◎● :2009/02/03(火) 05:43:55
>>180
ば・・・ばか!だんごやさんはもっと殺伐としてるべきなんだよ!!!!11111

184 :デフォルトの名無しさん:2009/02/03(火) 05:47:30
え、PS3上でも使えるんですか!?何でエラーが出るんだろう…。涙
ありがとうございます。

185 :デフォルトの名無しさん:2009/02/03(火) 08:05:13
根本的にスキルが足りてない気がするが……
ツンデレ団子がフォローしているから任せておくかw

186 :デフォルトの名無しさん:2009/02/03(火) 11:44:22
団子さんはherumi氏を超えた!

187 :デフォルトの名無しさん:2009/02/03(火) 19:40:21
しかもはるか斜め上!!

188 :デフォルトの名無しさん:2009/02/05(木) 13:55:16
ダンゴさんのネタ切れでスレが沈静化したな

189 :デフォルトの名無しさん:2009/02/05(木) 14:24:50
荒らすな。団子のせいにするな。

190 :デフォルトの名無しさん:2009/02/05(木) 14:55:40
んじゃネタ振り。

「任意の n に対し O(1) 解は存在し得ない。」

がんばって O(n) 最適化しよう。

191 :デフォルトの名無しさん:2009/02/05(木) 15:07:57
o(n)とO(n)が別物と最近知った俺には
ちょとむつかしすぎる問題だ

192 :デフォルトの名無しさん:2009/02/05(木) 15:08:52
正直現状で構わん。やってたこと荒らしと変わらないし。

>>190
n<=INT_MAXに限ればあり得るだろ?速度はさておき。

193 :,,・´∀`・,,)っ-○◎●:2009/02/05(木) 15:09:06
そこはO(log(n))解を探せよチキン

194 :デフォルトの名無しさん:2009/02/05(木) 15:25:55
おしまい

195 :デフォルトの名無しさん:2009/02/05(木) 15:54:06
O(n)に実質的に落ち着くんじゃないの?

196 :デフォルトの名無しさん:2009/02/05(木) 16:09:43
×O(n)に実質的に落ち着くんじゃないの?
>>195がO(n)のロジックしか思いつかない

197 :デフォルトの名無しさん:2009/02/05(木) 16:39:07
俺はO(n)で優勝する気満々だからおk

198 :デフォルトの名無しさん:2009/02/05(木) 16:39:47
ヒントを書かせようとしてる奴がいるな。
そんな奴はもう参加賞で我慢しる。

199 :デフォルトの名無しさん:2009/02/05(木) 16:55:41
>>197
無理だね。

気づいた人もいるだろうけど、O(n)を切るロジックは、ある。

200 :デフォルトの名無しさん:2009/02/05(木) 17:07:23
どうしてもCellっぽく書けない・・・
これじゃまるでHack the MTだ。orz

201 :デフォルトの名無しさん:2009/02/05(木) 17:11:20
なんか、13 も切ったしトランザムも(多分)解ったんだけど、なんか飽きちゃったw

202 :,,・´∀`・,,)っ-○◎●:2009/02/05(木) 17:17:25
ぶっちゃけCell自体に飽きた。

IntelのCtプログラミングの資料見つけたけどこれかなり面白い。
なによりC++ベースってのがよい。
CUDAやOpenCLよりよっぽど直感的に組める。__device__とか__gloval__とかアホか!


203 :デフォルトの名無しさん:2009/02/05(木) 17:45:28
話を逸らし始るくらいなら帰れ。

204 :,,・´∀`・,,)っ-○◎●:2009/02/05(木) 19:08:06
Frameworkの話なんだけど。理解できない奴は帰れよ。
CellをOpenCL対応させようとしてるのくらい知ってるだろ?

205 :,,・´∀`・,,)っ-○◎●:2009/02/05(木) 19:12:26
SpursEngineで遊ぶかな

206 :デフォルトの名無しさん:2009/02/05(木) 19:13:42
ところでCt使うと1000×1000の行列の逆行列が求められたりするわけ?

207 :,,・´∀`・,,)っ-○◎●:2009/02/05(木) 19:21:20
なんじゃそりゃ?
Intel CPUでできることは一通り出来ると考えて良いんじゃね?
仮想アドレッシングをデフォでメモリの制約は

プログラミングのノリとしてはThreading Building Blocksをもっと発展させたものって考えればいい。
見た目テンプレートベースのコンテナ、中身SIMD×マルチスレッドかな。

んで、中間言語がx86ベースで、ネイティブコードもx86。Intelベッタリ。
IntelのIntelによるIntel CPU/Larrabeeのための言語。

208 :,,・´∀`・,,)っ-○◎●:2009/02/05(木) 19:22:16
投稿ミス
×仮想アドレッシングをデフォでメモリの制約は
○仮想アドレッシングをデフォでサポートするからメモリの制約は基本的に無いと思って良いと思う

209 :デフォルトの名無しさん:2009/02/05(木) 19:38:12
要はFortranのベクタ演算の自動SIMD化っぽいものをC++でも出来るようにって事?
その程度のtemplateベースライブラリなら自作のがあるからなあ。
コンパイラの自動ベクトル化よりかは小回り利くけど
アドレスが単調増加しないような複雑なことをやろうとするとやっぱりOpenCLみたいな方がいいと思う。
ってOpenCL使ったことないで言ってる。

でもCtに関しては古い記事一つしか読んでないけど、仮装アドレッシングじゃなくて疎行列をサポートするって話じゃないの?

210 :,,・´∀`・,,)っ-○◎●:2009/02/05(木) 19:46:42
仮想アドレッシングはx86自体が持つ機能なので言語処理系でどうこうの問題じゃない。
VRAMが足りなくなればメインメモリやHDDにスワップということも理屈の上では可能ってこと。
結局はドライバに縛られるわけで、どこまでやるかは知らないが。

疎行列ねぇ。
それっぽいハードウェア機能はあるけど・・・。

CtはC/C++じゃなくて中間コードを吐く言語処理系だからC/C++の考え方はちと違う可能性はある

動的な再構成が可能って点ではネイティブのC/C++より優位性があるかもしれない。
SIMDが128ビットだろうが512ビットだろうが、1コアだろうが16コアだろうが
Ctのランタイムが動く限り、コアを有効に使うことが出来るって意味で。

CellでもSPMDのフレームワーク出てたよな?MARSだっけ?
ちと性能的にイマイチなんだが。。。

211 :デフォルトの名無しさん:2009/02/05(木) 19:49:25
>>209
密はダメか?

212 :209:2009/02/05(木) 19:56:44
>>210
とは言っても新しいベクタ長が出たらSIMDの基底型クラス追加するだけだし。
templateだから外側の配列クラスには影響しない。
当然多くの人にはそれが面倒だろうから助けにはなるだろうけど。

>>211
いや仮想アドレッシングをサポートするなら問題ないよ。
でもそうじゃないんじゃないの?ってだけ。
そうすると32bitプロセッサでは科学計算に使うようなばかでかい配列は用意できない。

メモリ4GB搭載も珍しくなくなって、OSも64bit版乗せるメーカーが出てきてるから
頑張って仮想アドレッシングをサポートしなくても
案外64bitへの移行は唐突にやってくるんじゃないかという気もしている。

213 :209:2009/02/05(木) 19:59:51
> 助けにはなるだろうけど。
「Ctの存在は」が抜けた。

214 :デフォルトの名無しさん:2009/02/05(木) 20:36:41
あー、ここでCtの話が始まってしまったか。
Intel某氏によると、CtのI/Fのオープン化を検討しているとか話があるようだから、
CellでもPLAでもなんにでも載せられる可能性はあるだろうね。
アーキテクチャごとに一一移植して調整すること考えたら楽になるよ。

215 :デフォルトの名無しさん:2009/02/05(木) 21:11:17
Ct を Cell に移植して調整するのはだれが?w

216 :,,・´∀`・,,)っ-○◎●:2009/02/06(金) 01:40:40
まあ、「Microsoft Visual Ct」が出てくるだけだと思ってるわけだが。

>>213
現時点ではLarrabee上でマイクロOSなるものが動くことが明言されてる。
インオーダでSIMDバリバリやる以上は、論理レジスタ16本くらい最低限欲しいから、
最初から64ビットになるんじゃないのかな。

ホスト上のOSとカード上のOSは基本的にメモリ空間が独立しててドライバ経由での通信になる。
このへんはフィックスターズの売ってるぼったくりCellカード上でYDLが動くのと同じ理屈かと。

217 :,,・´∀`・,,)っ-○◎●:2009/02/06(金) 06:16:36
困ったことに、PS4はGPUにLarrabee採用なんて噂が・・・


218 :デフォルトの名無しさん:2009/02/06(金) 07:30:58
んな話聞いたことねえよ。
中の人がお前にそう言ったのかもしれないし実際乗るかも知れないが、どう考えても(お前の/中の人の)脳内妄想の域。

開発するからにはあらゆる方法でスピードとコストバランスを検討するのは当然だから
その程度の噂でいいなら俺だっていくらでもホラ吹けるぜ。

219 :,,・´∀`・,,)っ-○◎●:2009/02/06(金) 07:33:25
http://www.theinquirer.net/inquirer/news/851/1050851/intel-design-playstation-gpu

http://www.techradar.com/news/gaming/sony-shoots-down-intel-gpu-in-ps4-rumours-525563

http://www.realworldtech.com/forums/index.cfm?action=detail&id=96090&threadid=95504&roomid=2←今ここ

220 :デフォルトの名無しさん:2009/02/06(金) 07:49:00
団子って、結構面白いところに居そうだよな。
そういうところに居る人間と居ない人間では触れる情報が全然違うんだから、
妄想だのなんだの言うだけ野暮。

221 :,,・´∀`・,,)っ-○◎●:2009/02/06(金) 07:59:48
居そうにみせかけてるだけで実は人一倍情報収集してるだけだったり。
Intelの開発者向けサイトなんて宝の山だぜ。

222 :デフォルトの名無しさん:2009/02/06(金) 09:05:26
Cellってもう4年位前のCPUなんだな
最新のCPUと戦い続けるのは無理があるだろうに
新型Cellとか出る気配もないしFixstarsこれからどうするつもりなんだろうなぁ

223 :デフォルトの名無しさん:2009/02/06(金) 09:11:19
Power ISA 2.06
http://www.power.org/resources/downloads/PowerISA_V2.06_PUBLIC.pdf
POWER 7に搭載されるVSXが追加
AltiVecの256bit拡張とか10年近く前から噂だけはあるけど全然見えてこないな。

224 :デフォルトの名無しさん:2009/02/06(金) 10:07:09
1337ページってすごいな

225 :デフォルトの名無しさん:2009/02/06(金) 12:30:50
Intel will design PlayStation 4 GPU
http://www.theinquirer.net/inquirer/news/851/1050851/intel-design-playstation-gpu

これが本当になったらfixstarsどうするの?
Cell専門って既に強みじゃないような気が・・・

226 :デフォルトの名無しさん:2009/02/06(金) 20:10:16
>>216
独自拡張の Visual Ct/CLI ですね、分かります

227 :デフォルトの名無しさん:2009/02/07(土) 03:30:32
アンローリング無しで20倍
HTC開始から40日。やっとここまでこれたわ


228 :デフォルトの名無しさん:2009/02/07(土) 16:15:27
>>225
MPUとGPUとは別にCell搭載するんじゃないの?


229 :デフォルトの名無しさん:2009/02/07(土) 16:25:38
sonyはCELLの為に工場作ったし、そう簡単にcellは捨てないだろう。

230 :デフォルトの名無しさん:2009/02/07(土) 16:32:51
団子より速そうな人のブログ見つけた。
チェックサムチートはしてないっぽいけど

結果が凄すぎて何やってるか想像つかない

231 :デフォルトの名無しさん:2009/02/07(土) 17:09:24
そのblog教えてください。

232 :デフォルトの名無しさん:2009/02/07(土) 17:22:46
近頃の奴は・・

ぐぐって探せカスが・・
つ"hack the cell"

それでも見つけられないならもう一度書き込め


233 :デフォルトの名無しさん:2009/02/07(土) 17:34:07
みつからねーよ
教えろ、このヤロー

234 :デフォルトの名無しさん:2009/02/07(土) 17:44:20
お前の書き方が気に入らないので教えない

1/31だ

235 :227 ◆eZQcaIaFJs :2009/02/07(土) 17:56:19
インラインアセンブラ無しで9.5cycleって神がかってるような…。


236 :227 ◆eZQcaIaFJs :2009/02/07(土) 18:04:10
ちなみに、Tempering+加算を「まじめに」やると11cycleかかるので、
トランザム組確定っぽいですな。


237 :デフォルトの名無しさん:2009/02/07(土) 18:52:25
>>234
ヒント

238 :デフォルトの名無しさん:2009/02/07(土) 19:25:18
>>237

235は自分でたどりつけたぞ。
お前もやれば出来るはず。

hack the cell
でググレば50件以内には出てるぞ

239 :デフォルトの名無しさん:2009/02/07(土) 20:45:22
ききっくすさんとかはまちさんとかその辺の人ことじゃないかなぁと予想

240 :デフォルトの名無しさん:2009/02/07(土) 22:13:06
トランザム組かそうじゃないかは処理時間/処理数の切片を見れば大体分かる
235のは概算で3000ticks位かかってるからトランザム組とみていいんじゃね

241 :デフォルトの名無しさん:2009/02/07(土) 22:15:21
>>236
なんか11である根拠とかあるのか?
15や13の壁だって破れるまではそこそこかかったはずだけど
と言いつつ俺は普通のやり方じゃ11.5も割ってないけど

242 :227 ◆eZQcaIaFJs :2009/02/07(土) 22:27:23
>>241
y ^= (y >> 11); // 2
y ^= (y << 7) & 0x9d2c5680UL; // 3
y ^= (y << 15) & 0xefc60000UL; // 3
y ^= (y >> 18); // 2
r += y; // 1

なもんで、11cycle切ってればトランザム組と判断してます。


243 :デフォルトの名無しさん:2009/02/07(土) 22:38:42
>>229
東芝に売却したような

244 :デフォルトの名無しさん:2009/02/07(土) 23:22:19
セカンドガレージってブログは団子さん家だったと思う。ちがったっけ?

245 :,,・´∀`・,,)っ-●◎○:2009/02/08(日) 04:07:27
>>242
そこも削れるだろ厳密に言えば

246 :,,・´∀`・,,)っ-○◎●:2009/02/08(日) 07:05:27
むしろtemperingを59命令未満にする方法を考えないと

247 :,,・´∀`・,,)っ-○◎●:2009/02/08(日) 09:04:32
なんで「second」なんだろうな?
たぶん、中の人の本サイトが別にあるからだと思うけど

248 :,,・´∀`・,,)っ-○◎●:2009/02/08(日) 09:26:26
>>229
あそにおると事件で有名な諫早のFabだろ?
既に東芝に1000億で売っちゃったよ。資金繰りに困って損切り。

249 :デフォルトの名無しさん:2009/02/08(日) 09:55:18
東芝も高い買い物したよなぁ。

250 :,,・´∀`・,,)っ-○◎●:2009/02/08(日) 10:06:23
ソニーからすれば減価償却考えても1000億は安すぎるわけだが
切らなきゃ大損害を被ってたろうね。

この度の不況により東芝は諫早も含めて生産規模縮小中。

251 :デフォルトの名無しさん:2009/02/08(日) 10:25:56
諫早はどうでもいいんだが、大分の縮小は困る。

252 :デフォルトの名無しさん:2009/02/08(日) 11:12:56
>>246
本命がその方法なら同じことをアセンブリでやってる俺の勝ちなんで非常に助かるんだがな
O(n)を切ってる奴には残念ながら勝てないがソース公開は楽しみでもある

253 :,,・´∀`・,,)っ-○◎●:2009/02/08(日) 12:25:55
残念だが俺は君とは違う方法をやってる

254 :デフォルトの名無しさん:2009/02/08(日) 13:08:53
団子さんの本サイトってどこ

255 :デフォルトの名無しさん:2009/02/08(日) 13:19:46
団子の正体は日本史の二流研究者
"日本史" "排仏毀釈"で調べれば見つかるぞ

256 :デフォルトの名無しさん:2009/02/08(日) 13:26:09
>>253
それは残念
3/20を楽しみにしとくよ

257 :デフォルトの名無しさん:2009/02/08(日) 21:42:58
コンテストと関係なくて初心者質問で恐縮ですが

SPEプログラムってマルチスレッドのみならず関数呼び出しの場合も
レジスタ全部退避するんでしょうか

もしそうなら全部main()で済ますのが正解?


258 :デフォルトの名無しさん:2009/02/08(日) 22:41:35
70番〜127番までのレジスタは関数呼び出しの前後で保存されてなきゃならないって決まりがあるっぽい
って事はレジスタが余ってる限りは退避しないようになってるんじゃないかと
確かめたわけじゃないから絶対とは言えんけどもレジスタ大量にあるのがSPEの特長だしね

259 :デフォルトの名無しさん:2009/02/08(日) 22:44:35
そういうのはABIで決まってるから

260 :,,・´∀`・,,)っ-○◎●:2009/02/08(日) 23:32:26
小さい関数なら__inlineキーワード付けなくとも最大の最適化オプションならインライン展開される

261 :デフォルトの名無しさん:2009/02/09(月) 10:49:54
素晴らしい解法を思いついたと思ったが
最終段がDLPだよ......orz.....検討し直し

262 :デフォルトの名無しさん:2009/02/09(月) 11:34:05
DLPって何の略?

263 :デフォルトの名無しさん:2009/02/09(月) 11:47:12
http://ja.wikipedia.org/wiki/DLP
プロジェクタの一種

264 :デフォルトの名無しさん:2009/02/09(月) 12:08:29
ありがと

265 :デフォルトの名無しさん:2009/02/09(月) 14:28:17
>>261
ニヤニヤ

266 :デフォルトの名無しさん:2009/02/09(月) 23:04:12
普通にやって10%切るの難しいって誰か書いてなかったっけ?
土曜から始めて、今、mtテーブルの初期化が終わった。
ループ展開などする前でも10%切るんだけど。かなりハードル低くないか?
それとも、このあとのTemperingがきついのかな?

267 :デフォルトの名無しさん:2009/02/10(火) 00:07:25
10%切るの意味が分からないけど10倍速は素直なSIMD化だけでできる

268 :266:2009/02/10(火) 00:16:40
>>267 普通そうだよな。それに、今回の課題はオリジナルがいちいち
関数呼び出しているからオーバヘッドが大きい。
だから、オリジナルの3%を切るくらいが普通の書き換え組みの最低ラインだろう。
とはいえ、俺がそのラインに届くかどうかどうか知らんが。


269 :デフォルトの名無しさん:2009/02/10(火) 10:30:49
3%はSIMD化してアンロールするだけで届く
普通の書き換えならそこからさらに倍速になってからが勝負


270 :デフォルトの名無しさん:2009/02/10(火) 22:57:42
駄法螺吹きが多いな、ここはw

271 :デフォルトの名無しさん:2009/02/12(木) 01:43:38
課題の制限で、mt_mine.c 以外のファイルを変更してはならないというのがあって、
spe 用のファイルの追加ができなくて困っているのだけど、
ttp://cell.fixstars.com/ps3linux/index.php/3.2%E3%80%80簡単なSPEプログラム

ttp://cell.fixstars.com/ps3linux/index.php/4.6%E3%80%80埋め込みSPEプログラム
以外で、どうやって spe 用のコードを書くのでしょうか。

272 :デフォルトの名無しさん:2009/02/12(木) 01:50:28
mt_mine.cをいじるだけで事足りるんじゃ?

273 :デフォルトの名無しさん:2009/02/13(金) 00:54:08
>>272
spe 用の main を mt_mine.c に書くと一つのバイナリに二つ main が入ることになってシンボルが衝突してしまいます。
また、spe2 のライブラリにリンクしないと、spe_program_load などがリンカエラーを起こします。
Makefile を変更しないとどうにもならない気がするのですが、何か根本的に間違えているのでしょうか。

274 :デフォルトの名無しさん:2009/02/13(金) 02:46:28
>>273
根本的に間違えてるよ

そもそもppeプログラムは不要で,speプログラムだけしかない.
コンパイルしてできた実行ファイルを実行すると1つのSPEにロードされて処理される.

275 :デフォルトの名無しさん:2009/02/13(金) 08:14:29
たいして量ないから課題についてきたすべてのファイルのぞいてみな。
全体の構造がわかるから

276 :デフォルトの名無しさん:2009/02/14(土) 00:48:22
>>267
ソース見せて?
いや、ホントに素直なSIMD化だけで?


277 :デフォルトの名無しさん:2009/02/14(土) 00:49:48
>>274
>>275
ありがとうございます。腑に落ちました。

278 :デフォルトの名無しさん:2009/02/14(土) 20:04:19
SIMD化したら単純に4倍になるだけじゃないからな
SPEでスカラ演算しようとしたらそれ以上のコストがかかる

279 :デフォルトの名無しさん:2009/02/15(日) 17:23:24
デバッグプリントはさむと実行できるのに
そのコードをコメントアウトすると10回に6回位実行が止まりやがる
どうやらSPEがDMA転送するあたりで止まってしまっているみたいだ
デバッグ難しいねえ


280 :デフォルトの名無しさん:2009/02/15(日) 17:55:51
>>279
普通のPCではお目にかかれない現象だなぁ。
なんちゅうシビアな。。。

281 :デフォルトの名無しさん:2009/02/15(日) 18:01:53
>>280
昔のPCだと、CPUクロックが上がった所為で周辺ICがついてこれず、ハングアップするなんてことがあった。
対処方法は、I/O制御インストラクションの間にnopインストラクションを幾つか挟むことだったり。

282 :デフォルトの名無しさん:2009/02/15(日) 18:10:33
>>280
PCでもデバッグするのにprintf入れたらバグがでなくなるとか遭遇しないか?w

283 :デフォルトの名無しさん:2009/02/15(日) 18:14:44
>>281
それもシビアですなぁ。CPUを待たせるっていうのは思考と対立するなぁ。

>>282
VCのデバッガ最強伝説。標準の関数消したら直ったっていうのはは今までないね。多分。

284 :デフォルトの名無しさん:2009/02/15(日) 18:19:24
あ、printf入れたらか。そっちもないけどさ。
そんなシビアな環境でやってないからかな。。。

285 :デフォルトの名無しさん:2009/02/15(日) 18:40:01
止まらなくなった。何が何やら分からない。きっと今日は風が強かったからCellBE様のご機嫌がちょっと
悪かったんだな、うん

286 :227 ◆eZQcaIaFJs :2009/02/15(日) 18:41:44
>>279
同じような事で悩んだりしたのでヒントっぽいものを。

・align16 付けてますか?(SSE と違って実行時の例外は無し)
・アセンブラから書き換えるグローバル変数は volatile にしてますか?

今のところ spu-gcc-4.3 の致命的なバグに遭遇した事は無かったりもします。

>>282
割り込み属性を指定してる関数で破壊するレジスタを待避しないコンパイラや、
ABIを無視して呼び出し先関数で使用しているレジスタしか待避しないコンパイラなら
見たこと有りますよ。


287 :デフォルトの名無しさん:2009/02/15(日) 18:42:14
と思ったけど止まったぜヒャッハァー

288 :デフォルトの名無しさん:2009/02/15(日) 18:44:36
まぁ、アライメントだろうな。

289 :デフォルトの名無しさん:2009/02/15(日) 19:08:21
>>283
デバッガ関係ないし。
シビアなマルチスレッドプログラミングしてたらよく起こる

290 :デフォルトの名無しさん:2009/02/15(日) 19:12:04
printfでうまくいくケースはメモリ周りだろ
アロケーションしてないとこの参照とかあるとそうなる

291 :デフォルトの名無しさん:2009/02/15(日) 19:31:26
みなさんどうデバッグしてます?経験?デバッガ?

292 :デフォルトの名無しさん:2009/02/15(日) 19:37:38
>>291
ただの趣味グラマだけど、基本はVCのデバッガで引っ掛けて、引っかかったらカンと経験っぽいもので何とかしてる。
一応、ユニットテストっぽいこともやるにはやってるかな。

293 :デフォルトの名無しさん:2009/02/15(日) 19:39:09
今回はprinf( )デバッグだけで済んだ。
というか、リモート・デバッガ動かなかったから
prinf( )デバッグしただけなんだな。

294 :デフォルトの名無しさん:2009/02/17(火) 02:58:04
コンテストも終盤だし、スレの勢いも落ち着いてきたね

295 :デフォルトの名無しさん:2009/02/17(火) 10:13:53
コンテストの目的って何なの?
Cellでなければ不可能な最適化や高速化の技術があるはずだ、って事なの?
SFMTとは違う事をやるの?

296 :デフォルトの名無しさん:2009/02/17(火) 10:48:13
>>294
誰ももう手の内を明かしたくないってことだろう。
>>295
いわゆる惰性って奴じゃないか?

297 :202:2009/02/17(火) 10:57:17
F1みたいに厳しい制限の中でトップを争うレースかと思ってたのに、
何でもあり or 曖昧な評価基準 のレースになってしまって、やる気が
無くなった。ここ2週間何もしてない。

一応提出できるレベルには持っていく積もりだけど、Fixstars賞すら狙えない
レベルに落ちぶれてしまった。

298 :デフォルトの名無しさん:2009/02/17(火) 14:20:34
今はCell Challengeの方やってんぜ
提出締め切りがこっちの方が近いからな

299 :デフォルトの名無しさん:2009/02/17(火) 15:32:43
>>298
俺もやってんだがこっちはツールキットの10倍すら厳しい・・・
しかもOpenCafe上でやるとたまにだが実行時間がめちゃめちゃ遅くなるし

今ホームページみたらQ&Aが更新されてた
遅くなる事象が報告されてるみたいだな

300 :デフォルトの名無しさん:2009/02/17(火) 19:47:29
いったいどんな属性のやつが優勝するんだろう?

301 :デフォルトの名無しさん:2009/02/17(火) 19:51:51
暇人である事は確かだろう

302 :デフォルトの名無しさん:2009/02/17(火) 20:20:34
おれは暇人に該当するがさすがに職場からリモートでするほどの勇気or気力はないな。
つか不景気だし。

カレーだいすき
れんこんだいすき

303 :デフォルトの名無しさん:2009/02/17(火) 22:14:20
>>295
本来の目的は前者、つまり、あなたが言うような「Cellでなければ不可能な最適化や
高速化の技術があるはず」だと思うよ。そこら辺が曖昧になったから、

>また予想以上の盛り上がりに感謝し、「実用性に優れている」と弊社にて判断した
>プログラムに対して「フィックスターズ賞」を追加することに決定しました。

>「実用性に優れている」と判断する基準
>* MT 乱数 (tempering された乱数) を生成している
>* オリジナルコードと同じ順序で乱数を出力している
>* MT 乱数を簡単に取り出せること (関数の戻り値, 配列に格納, など)
>* 高速である
>※上記の基準をもとに総合的に判断します。

という具合に「フィックスターズ賞」を作ったのだと思う。
要は、即戦力になる人材に応募して欲しいんだろ。

.>「実用性に優れている」と弊社にて判断した
^^^^^^^^^^^^^^^^^^
という一文が重要なんだよ。

304 :デフォルトの名無しさん:2009/02/18(水) 07:24:34
ノーベル賞も実用性、実効性が最初に問われるんだってよかったね。

305 :デフォルトの名無しさん:2009/02/18(水) 15:14:05
プログラミングの質問なんですが、
DMA転送する際に構造体のメンバがポインタだとSPUで読み取れないんですか?

306 :デフォルトの名無しさん:2009/02/18(水) 15:41:51
エスパーレスするが、
取得したポインタを用いてさらに別途DMA転送しろってことじゃないか?

307 :デフォルトの名無しさん:2009/02/18(水) 19:49:40
おいお前ら
メモリ足りてる?

308 :デフォルトの名無しさん:2009/02/18(水) 20:16:34
>>307
とりあえずループ展開終わっただけの段階だけど、足りてる。
ファイルサイズだと253.0k。チューニングすればもう少し減ると思うが
コンパイラがどう最適化するか判らないから、増えるかも?

309 :デフォルトの名無しさん:2009/02/18(水) 23:05:16
前スレの「ていうか頭足りてる?」を思い出した

310 :デフォルトの名無しさん:2009/02/19(木) 20:12:03
IBMのCell Broadband Engine Programming Handbookがリンク切れなのは何故。。

311 :デフォルトの名無しさん:2009/02/20(金) 02:34:19
消したって事は必要無いからなんじゃないかね?
PowerXCell 8iを含むって書いてあるけど、こっちで用が足りるんじゃない?
ttp://www.ibm.com/chips/techlib/techlib.nsf/techdocs/1741C509C5F64B3300257460006FD68D?Open&S_TACT=105AGX16&S_CMP=LP

312 :デフォルトの名無しさん:2009/02/20(金) 19:27:42
あと2週間、だっぞ。

159-1名の君たち、せいぜいがんばれや。

313 :デフォルトの名無しさん:2009/02/22(日) 00:33:27
159って何?
そんなに参加してるの?

314 :デフォルトの名無しさん:2009/02/22(日) 22:23:47
駄目だなぁ、どうしても3%を超える事すら出来ない。
命令順序を入れ替えても変化なしだ。

315 :デフォルトの名無しさん:2009/02/24(火) 21:22:11
フィックスターズ、Cell活用のH.264リアルタイムソフトウェアエンコーダ
http://journal.mycom.co.jp/articles/2009/02/24/fixstars_powerxcell8i/index.html

316 :デフォルトの名無しさん:2009/02/24(火) 21:33:44

ルイスvsホリフィールドを久々に見せてもらったよ

317 :,,・´∀`・,,)っ-○◎●:2009/02/24(火) 21:39:05
中の人が言ってたアレ完成したのか

318 :227 ◆eZQcaIaFJs :2009/02/25(水) 01:03:24
[チラシの裏]
プロファイラの結果見ながら片っ端からソース書き換える仕事も一段落して、
次はOpenMPのマルチスレッド地獄。楽だと思って甘く見てたら、今日だけで
落とし穴に2回も落ちてしもうたよorz 目標の100FPSまでもう少し。

>>297
気力出なくて放置してるのはわっちも同じです。トランザムさえ無ければ
5位以内に入れる自信は有ったのになぁ…。


319 :デフォルトの名無しさん:2009/02/25(水) 01:27:14
お互いに牽制し過ぎて、勝てないと思ってみんな提出しなくてノーマルな方法で優勝可能というオチだったりw


320 :デフォルトの名無しさん:2009/02/25(水) 01:38:04
159名がどこから来た数字かやっと分かった。
これは見つかるのかw

321 :,,・´∀`・,,)っ-○◎●:2009/02/25(水) 02:42:06
>>318
俺がガンダムだ

322 :デフォルトの名無しさん:2009/02/25(水) 10:56:18
SIMD化すると遅くなるんですがなぜですか?

323 :デフォルトの名無しさん:2009/02/25(水) 15:34:40
依存チェンじゃね?
とcellを知らないオレが答えてみる

324 :デフォルトの名無しさん:2009/02/25(水) 20:17:42
なぜですかって聞いちゃだめでしょう。ルール的に

325 :デフォルトの名無しさん:2009/02/25(水) 22:23:39
トランザムって何?
禁じてなのか

326 :デフォルトの名無しさん:2009/02/25(水) 22:27:28
>>325
俺も何か高等テクニックなのかと思って近くの奴に
トランザムって知ってるか?
と聞いたら最近のガンダムがどれぐらい面白いかの話をされた

327 :デフォルトの名無しさん:2009/02/25(水) 22:34:32
> トランザムって

厨二病

328 :デフォルトの名無しさん:2009/02/25(水) 22:39:49
トランザムシステム(TRANS-AM)
オリジナルのGNドライヴに予め組み込まれていたシステム。
機体内部に蓄積されていた高濃度圧縮粒子を全面開放することで機体が赤い光に包まれ、
スペックを3倍以上に上げることができる。しかし、このシステムは大量のGN粒子を消費し、
使用時間の制限と、時間終了後は粒子の再チャージまで機体性能が大幅に低下するなど、
諸刃の剣である。イオリアがヴェーダが何者かによって破壊、もしくは掌握されたときのために
温存していた最後の希望であった。

329 :デフォルトの名無しさん:2009/02/25(水) 22:53:24
>>322
俺がいる

330 :デフォルトの名無しさん:2009/02/25(水) 23:38:51
コンテスト終了後はソース公開されるんでしょ?
それ見ながら、このスレでトランザムについて解説してもらったらおk

331 :デフォルトの名無しさん:2009/02/26(木) 02:44:03
fixstarsが今度Cellプログラミング実践セミナーを開くそうだけど、行く人いる?
自分は考え中・・・

332 :デフォルトの名無しさん:2009/02/26(木) 12:53:22
俺はトランザムって、てっきり車(スポーツカー)の事だと思ってた。
まさか最近のアニメ(ガンダム00)の話だったとはw。

333 :デフォルトの名無しさん:2009/02/26(木) 12:56:33
>>332
それは元々、TRANS AMericanでアメリカ横断と言う意味だな。

334 :デフォルトの名無しさん:2009/02/26(木) 13:03:19
>321
「俺がガンダムだ」の意味が分かったよ。
そんなもん分かりたくもなかったがw。

335 :デフォルトの名無しさん:2009/02/26(木) 16:29:26
speedchallengeはもうだめだ
「他のジョブが動作中です」的なエラーがでて何も出来ない

336 : ◆imos.WO182 :2009/02/26(木) 18:43:54
Cell Challengeだけどまだプログラムを書いてる途中で一度も動かしていない\(^o^)/オワタ
こんな長いコードのデバッグとか正直あと1日で無理だろ,常考…orz


337 :デフォルトの名無しさん:2009/02/26(木) 19:28:04
俺はバグとり合戦開始した。コンパイラはエラーはかないけど、正しい結果が得られない 
明日の夕方に間に合えばいいが

338 : ◆imos.WO182 :2009/02/26(木) 22:50:55
ぉぅ,こっちは今からやっとバグ取り合戦だぜ.
徹夜してがんばろう.しかしチューニングまでは到達しないかもしれn…

Another jobが云々は他の人もがんばってるってことかな.
がんばらないと…


339 :デフォルトの名無しさん:2009/02/27(金) 01:57:17
>>335
ターミナルでcellunlockするといけるってどこかに書いてあった気がする

340 : ◆imos.WO182 :2009/02/27(金) 03:20:47
90%ぐらいの確率で答えを正しくだすけどっていう状況になってしまた\(^o^)/
それも実行する度に正しかったり1違ったり…orz
DMA転送の付近で順序がおかしくなってるんだろうなー…

341 :デフォルトの名無しさん:2009/02/27(金) 03:24:40
間に合わないだろう、さすがに。

342 :デフォルトの名無しさん:2009/02/27(金) 05:23:23
あきらめってきもちいいです

343 : ◆imos.WO182 :2009/02/27(金) 05:58:03
別のバグを見つけて解決したけどなぜ時々正解していたかは未だに謎
とりあえず命令順序を良いように変えてくれるコンパイラに感謝

ところで Cell challenge って短い文字列でも勝負やるのかね
もしかしたらそもそもSPU起動しない方が速いとかありうるけど
まぁあまり気にしないでおくべきか

344 :デフォルトの名無しさん:2009/02/27(金) 17:07:12
PS3に比べてOpenCafeだと全く速度が出ない
サイズの小さい問題ほど顕著で
128x256:7.3%
5120x5120:11.6%
20480x20480:42.4%
73600x73600:90.1%
の速度しかでない
PS3で開発してたもんだから今提出してがっかりした
何が原因なんだ

345 :デフォルトの名無しさん:2009/02/27(金) 17:27:16
実はPS3とOpenCafeのPPE-SPE間,SPE-SPE間通信時間を比べると
OpenCafeのほうが1.5倍の時間がかかってるんだよな

SPEプログラム呼び出しに至ってはOpenCafeのほうは絶望的に遅い


346 :デフォルトの名無しさん:2009/02/27(金) 17:47:00
少なくともSPEの起動・終了を使い回したりはしてないんだがなあ
SPE間通信とシグナル通知レジスタあたりが怪しい気がする

347 :デフォルトの名無しさん:2009/02/27(金) 19:44:24
単純にコンパイラの違いとか

348 :デフォルトの名無しさん:2009/02/27(金) 20:05:34
携帯電話に対抗するPSP2、CellとLarrabeeで揺れるPS4
http://pc.watch.impress.co.jp/docs/2009/0226/kaigai492.htm



349 :デフォルトの名無しさん:2009/02/27(金) 20:28:21
ゲハ厨?

350 :314:2009/02/28(土) 23:08:14
うーん、相変わらず駄目だ。2月に入ってから作成始めて、
出来るだけ土日のいずれかは使ってるんだけど、オリジナルの
3%を超えられない。
ぎりぎりまで頑張ってみるけど、コンテストに出さないかも。

いい加減、土日はフルに休みたいし、めんどくせぇなw

351 :デフォルトの名無しさん:2009/03/01(日) 00:51:06
135 の扱いが厄介だ。

352 :デフォルトの名無しさん:2009/03/03(火) 17:02:50
Cell Challenge予選の結果が発表された
(入力をまだみれてないのでおそらくだけど)
2^34の問題が0.2秒で解けてるチームが1位っぽい

353 :デフォルトの名無しさん:2009/03/03(火) 21:44:08
imosさんてチームimoか?はえーなあ

354 : ◆imos.WO182 :2009/03/04(水) 15:43:01
お察しの通りチームImoですー
2^34が1秒切ったと喜んでいたけども1位とは4倍の壁…
evenの埋まってる率はおそらく7割以上なのでアルゴリズムの変更が必須で悩み中


355 :デフォルトの名無しさん:2009/03/05(木) 00:22:49
1位のチームの人Anthyの開発者?

356 :デフォルトの名無しさん:2009/03/05(木) 00:51:29
何気にハックざセルの提出期限近いな
優勝ラインはどれぐらいだろうな?

4.5Mぐらいだと予想しているんだが

357 :227 ◆eZQcaIaFJs :2009/03/05(木) 01:20:01
# OpenMP で並列化出来るところが少なすぎて発狂しそう…。

>>354
今週の土曜日になれば Hack the Cell のネタバレ解禁だと思うので、
パイプライン両方埋めるテクニックが盗めるかもしれませんよ。

>>356
数字書いちゃうとアレな気もしますが、一月末の時点で3.5M突破
している方もいますよ。


358 :デフォルトの名無しさん:2009/03/05(木) 01:39:03
それはすごいな。
でも、まだフィクスタ賞のチャンスは俺には残ってるはず。

359 :,,・´∀`・,,)っ-○◎●:2009/03/05(木) 03:57:11
ああ、ふぃく☆すた賞狙ってる人は、コンパイラを飼い慣らすテクニックのほうを重視したほうがいいかもです。

360 :デフォルトの名無しさん:2009/03/05(木) 08:54:15
コンパイラを飼い慣らすって
そんなに差がでるのですか

361 :デフォルトの名無しさん:2009/03/05(木) 11:46:33
え、gccに限らずVCだろうがiccだろうがコンパイラとの格闘だぜ?

362 :デフォルトの名無しさん:2009/03/05(木) 12:29:30
自分はオプションにアンロールとO3つけてstripぐらいしかしてないです。
さすがに-pgとかつけたままにしたりましませんが・・・
けどその位を殺っておけばいいだろうという認識です。
そんなに激しく差がでるのかー

363 :デフォルトの名無しさん:2009/03/05(木) 23:56:56
コンパイルオプションはいじったらだめなんじゃ…

364 :デフォルトの名無しさん:2009/03/06(金) 02:44:34
自分はcell challengeなので。

365 :デフォルトの名無しさん:2009/03/06(金) 11:43:09
無意味なラベルを入れておくとかそういうおまじないレベルの事はやらなくて大丈夫なんだよね?

366 :デフォルトの名無しさん:2009/03/06(金) 14:47:21
O3だと動かない\(^o^)/

367 :デフォルトの名無しさん:2009/03/06(金) 22:13:16
今日でひとつの祭りが終わるなぁ。勉強になったし楽しめたよ。満足満足

368 :デフォルトの名無しさん:2009/03/06(金) 22:37:56
残念なこともあるにはあるけどなかなか楽しめたな
しばらくしたらコード公開されるのかな
それとも20までお預けかな

369 :デフォルトの名無しさん:2009/03/07(土) 01:56:36
へるみさんは80倍ちょっとか。

370 :227 ◆eZQcaIaFJs :2009/03/07(土) 02:35:40
ビット入れ替え思いつかずに、12cycleの壁超えられなかったもします。
フィックスターズ賞狙いですが、99%越えの接戦に勝てるか不安…。


371 :デフォルトの名無しさん:2009/03/07(土) 10:32:23
トランザムってどうやって加算したの?
spu_cntbとかをうまく使うの?
締め切りすぎたけど、結果発表までは内緒なのかな…

372 :202:2009/03/07(土) 11:05:43
俺なんか12.3cycle/qwordだ。ランク外orz

373 :デフォルトの名無しさん:2009/03/07(土) 11:48:08
で、トランザムって何なの?
俺が・・・が出自ってことは分かったけれど

374 :,,・´∀`・,,)っ-●◎○:2009/03/07(土) 11:50:25
>>371
spu_cntbは最初に思いついたね

たとえば、
cntb(a) << 24 | cntb(b) << 16 | cntb(c) << cntb(d)
を8組作って、左シフト+加算で畳み上げるってのはどう?
8ビット単位のシフト+論理和ならspu_shuffleでできるからOddパイプ側で処理を割り振ることもできるし
このへんはいろいろやりようは有ると思う。

どっちかというとmt[]の更新のほうがめんどいんだ。
どういうレイアウトを組むかによってOddパイプの演算量が全然変わってくる。

375 :371:2009/03/07(土) 11:51:50
>373
たぶんbitを90度回転したんじゃないかと。
01234...
01234...

0000
1111
...
な感じに。

376 :,,・´∀`・,,)っ-●◎○:2009/03/07(土) 11:59:16
( cntb(a) << 24 ) | ( cntb(b) << 16 ) | ( cntb(c) << 8 ) | cntb(d)
に訂正しときます

>>373
俺が最初に言い出しました。transpose + sumだからトランザム(笑)
あと速いし。さすがにmt[]の更新のほうがネックで3倍にはならないようだけどね。

なんのことはない、1bit×128並列のSIMD演算ですよ。
暗号のクラックなんかでよく使う方法です。

377 :デフォルトの名無しさん:2009/03/07(土) 12:41:24
>>376

やっぱり1bitx128並列の事だったか。
その方法ならshift無くせるしxorとかの回数も減らせることは気が付いてたけど
めんどくさいからやらなかった。

やった場合には1要素平均何cycleまでいくものなんだろう?

378 :,,・´∀`・,,)っ-●◎○:2009/03/07(土) 12:48:45
>>377
ブログなんかで「大台」って言ってる人がいるけど、これは100倍のことだと思うよ。
だから2クロック切るくらいかな。


379 :デフォルトの名無しさん:2009/03/07(土) 12:57:04
鬼すぎるw

380 :227 ◆eZQcaIaFJs :2009/03/07(土) 12:57:45
The Art of Multiprocessor Programming 届いた。普通に神本っぽい。
ところで、KLabの中の人ってこのスレの住人だったりするのだろうか…。

>>372
12.3は何とか超えたけど、その少し先で詰まっていたりもします。

>>376
普通に translate + sum だと思ってましたo r z


381 :,,・´∀`・,,)っ-●◎○:2009/03/07(土) 13:21:59
ちょうどビット配列の転置アルゴリズムを「ハッカーのたのしみ」なんかが扱ってる

http://www.hackersdelight.org/HDcode/transpose32.c


382 :デフォルトの名無しさん:2009/03/07(土) 13:45:25
temperingはそれこそすげー速くなるんだけどMT[i+1]とMT[i+M]のロードがなかなか難しいよね
いろいろやったけど命令数的に90倍速程度が理論限界で諦めた
コンパイラはレジスタ足りないってわめくし

結局普通の方法で11.75/cycleの68倍速で提出したよ
こっちのコードの方が最適化自体に手間掛けたから気に入ってるんだ

383 :デフォルトの名無しさん:2009/03/07(土) 13:46:47
11.75cycle/QWORDだた

384 :デフォルトの名無しさん:2009/03/07(土) 15:08:23
ところでオレ以外に学生部門の人はいないの?
学生参加は手を上げて!!


385 :,,・´∀`・,,)っ-●◎○:2009/03/07(土) 15:14:07
>>382
mt[i+1]のほうは奇数・偶数みたいな分け方をすればpermuteの回数を「減らす」
くらいは出来るという結論に達した。

幸いなことに先頭から226個まではは並列実行できるし。
ただ、128ビット全部使うことは諦めないといけない。
1レジスタにビットを限界までの6分割とか8分割とかにしないといけない。


参加者が少なかったせいか10倍すら超えなくても参加賞は貰えることになったらしいので
ウケを狙うのもアリだったな。


386 :,,・´∀`・,,)っ-●◎○:2009/03/07(土) 15:15:37
○1レジスタにビットを限界まで詰めることを諦めて104ビットずつ6分割とか78ビットずつ8分割とかにしないといけない。


387 :デフォルトの名無しさん:2009/03/07(土) 15:35:29
>>385

全員参加賞もらえるなんてどっか出てたか?
フィクスタの社長ブログとかには参加者159人とか載ってるし、参加者少なすぎとかは無いんじゃないか?

388 :,,・´∀`・,,)っ-●◎○:2009/03/07(土) 15:38:20
http://cell.fixstars.com/challenge/entry.html

参加者特典
課題提出者全員に参加賞をプレゼントいたします。



ボールペンかなんかの予感

389 :デフォルトの名無しさん:2009/03/07(土) 15:41:17
>>388
ほんとだ。疑ってすまんかった。
いつの間にか変わっていたんだな。

390 :デフォルトの名無しさん:2009/03/07(土) 17:39:43
「トランザム」 = 「とらん、sum」かとおもてたよ
Tempering後のchecksumをとらないのかと。どやってやるんだそんなのと

391 :デフォルトの名無しさん:2009/03/07(土) 17:46:47
kikxさんとこのが良く分からない
乱数生成の順番は入れ替わりそうだけど転置ではなさそうだ

392 :,,・´∀`・,,)っ-●◎○:2009/03/07(土) 17:52:46
> z = si_lqx(spu_slqw(spu_gather(y), 4), mag_lut);
> r = spu_xor(spu_rlmaskqw(y,-1), z);

懐かしい


左4ビットシフトもspu_shuffleでできるよね?
このへんはみんな気づいたかなと思うけど。


393 :デフォルトの名無しさん:2009/03/07(土) 18:23:39
シャッフル1回でってこと?
想像もつかない

394 :227 ◆eZQcaIaFJs :2009/03/07(土) 18:26:58
何となく11.75になる方法分かったorz


395 :デフォルトの名無しさん:2009/03/07(土) 18:32:16
>391
mt[]の中の順番が入れ替わるだけ、かな?

>392
団子さんは結局何倍までいけました?

396 :,,・´∀`・,,)っ-●◎○:2009/03/07(土) 18:35:33
spu_gatherやるとさ、プリファードスロットの下位4ビットにLSBが集約されるじゃん。
で、他は0になるじゃんじゃん。

spu_shuffleの第一引数に
{ 0x00, 0x10, 0x20, 0x30, 0x40 ,,, 0xF0 }
ってベクトルブッ込むわけだ。

spu_shuffle( pattern, pattern, (vec_uchar16)spu_gather(y) )

これで
spu_slqw(spu_gather(y), 4)

とまったく同じ結果になる筈。



397 :,,・´∀`・,,)っ-●◎○:2009/03/07(土) 18:36:06
>>395
ノーコメント

398 :,,・´∀`・,,)っ-●◎○:2009/03/07(土) 18:40:04
shinhさんが俺をオフ会に誘ってるようですなwww

399 :デフォルトの名無しさん:2009/03/07(土) 18:42:31
>>396
なるほど
そういえば最初のうちは似たような使い方することで
shuffleの定数生成機能を利用して1bitシフトしようとかしてたなぁ

400 :デフォルトの名無しさん:2009/03/07(土) 18:45:48
でも、フィックスターズで会合セッティングするって、
社長blogに書いてあったよね。

401 :デフォルトの名無しさん:2009/03/07(土) 18:49:47
団子の自演か。

402 :デフォルトの名無しさん:2009/03/07(土) 18:49:50
入賞者以外も招待されるとしても気遅れしてしまって行けそうにない

403 :,,・´∀`・,,)っ-●◎○:2009/03/07(土) 18:59:24
そもそも人材スカウト前提のプログラミングコンテストじゃねーの?
shinh氏はGoogleだから興味はなさそうだなー

404 :デフォルトの名無しさん:2009/03/07(土) 19:22:19
>>403
おたくは誘われたら行くの?
それとももっと良いとこに勤めてたりすんの?

405 :,,・´∀`・,,)っ-○◎●:2009/03/07(土) 19:25:38
そもそもFixstarsっていいところなのかね?
Cellに将来性を感じない

406 :デフォルトの名無しさん:2009/03/07(土) 19:26:29
なんという正直な意見

407 :デフォルトの名無しさん:2009/03/07(土) 19:34:30
現状じゃCellにいいことないよね
LarrabeeとかGPUとかにも浮気するのかCell自身の発展があるのかどちらかじゃないと
それに
>経験、能力を考慮の上、当社規定により決定
は怖すぎる

408 :デフォルトの名無しさん:2009/03/07(土) 19:38:01
団子の自慢か。

409 :デフォルトの名無しさん:2009/03/07(土) 20:01:06
shuffleでシフトって意味あるの?
命令数も使用パイプラインも変わらない気がするんだけど…

410 :,,・´∀`・,,)っ-○◎●:2009/03/07(土) 20:03:46
要素単位のシフトはevenでshuffleはodd

411 :デフォルトの名無しさん:2009/03/07(土) 20:11:52
すると>>396はこういうこともできるってだけで
別に意味はないのか

412 :,,・´∀`・,,)っ-○◎●:2009/03/07(土) 20:15:06
ところで貴様らソースコードの先頭ってコレ入れた?

/*
* Copyright 2008-2009 ***********. All Rights Reserved.
*
* Redistribution and use in source and binary forms, with or without
* modification, are permitted provided that the following conditions
* are met:
(中略)
*/


いや、BSDLで公開するなら常識だよな?

413 :,,・´∀`・,,)っ-○◎●:2009/03/07(土) 20:16:36
>>411
あるよ。普通の方法でやるとevenが余る。
evenでもoddでも等価な演算が出来る場合は、パイプラインの充填率をみて微調整ができるだろ。

414 :デフォルトの名無しさん:2009/03/07(土) 20:27:23
そしたらslとslqwの使い分けでいいような

415 :,,・´∀`・,,)っ-○◎●:2009/03/07(土) 20:35:43
それもそうだな

ケースを選ぶけどvec_uchar16に対応するシフト・ローテート命令としても使えるんだよ

416 :デフォルトの名無しさん:2009/03/07(土) 20:39:16
これって優勝と準優勝しかないんだろ?
せめて参加部門中で自分が何位くらいだったか知りたい

417 :,,・´∀`・,,)っ-○◎●:2009/03/07(土) 20:40:13
それでもFixstarsならブービー賞を用意してくれるッ!

418 :デフォルトの名無しさん:2009/03/07(土) 20:43:15
>>417
あるかもなそれも。あったとして賞品はなんだろう?

てか俺は賞はいらんから純粋に自分がどのくらいの実力なのか
相対的な位置を尻たいのさ

419 :デフォルトの名無しさん:2009/03/07(土) 20:44:12
>>415
ああ、確かにslqwでできなくてshuffleでできる演算はあるな
参考になった、ありがとう

420 :,,・´∀`・,,)っ-○◎●:2009/03/07(土) 21:27:20
んなところでオリジナルのGNドライブ(違)です

http://tripper.kousaku.in/20090307.html

421 :デフォルトの名無しさん:2009/03/07(土) 21:40:27
トランザムはともかくアルゴリズムについてはもともと分かってた人間もいると思うぞ

422 : ◆imos.WO182 :2009/03/07(土) 22:00:11
cntbだけじゃなくsumbのことも忘れないでやってくださいです…

423 : ◆imos.WO182 :2009/03/07(土) 22:41:49
ってよく見たら本文に書いてあったね,すませ.
しかしできればコード本体も書き直したのを載せておいた方が後の人のためにも.

424 :,,・´∀`・,,)っ-●◎○:2009/03/07(土) 22:43:09
書き直したやつ上げといた

425 :,,・´∀`・,,)っ-●◎○:2009/03/07(土) 22:44:47
shinh氏のはsumb使うときにオール0のレジスタ指定とかやったらしいが
実はそれが敗因だったんじゃねーのか?
いや、mt[]のほうが大変なんだけどね


426 : ◆imos.WO182 :2009/03/07(土) 23:35:18
すばやい対応乙です
しかし実はこのスレに圧倒されてHack the CellからCell Challengeに逃げ(ry
とまぁそれはさておきここのsumbの引数の活用は意外と大きいかも?
単純計算0.5cycle/qwordは変わるし

427 :デフォルトの名無しさん:2009/03/07(土) 23:55:47
あれ、cntb はレイテンシ4じゃねの。そしてsumbはevenじゃねの。

428 : ◆imos.WO182 :2009/03/08(日) 05:04:38
スループットのみを考えての計算だったのだけど
128個に対して16命令余分→4個に対して0.5命令余分みたいな
もしevenが余ってたらあまり増えない可能性も十分にあると思うが

429 :,,・´∀`・,,)っ-●◎○:2009/03/08(日) 05:46:51
コメントはかなりいい加減です。

430 :,,・´∀`・,,)っ-●◎○:2009/03/08(日) 05:49:02
>>428
mt[i+1]なんかの算出の平均コストはそんなもんじゃすまない。

431 : ◆imos.WO182 :2009/03/08(日) 14:51:27
>>430
というかトランザムって言ってるなら+1なんてローテートの長さが変わるだけなんじゃ?

自分の書いた古いメモには128個の生成に1行あたり
LD,LD,ROT(16),ROT(16),SEL,XOR,XOR*.5(mag01),(*tempering),ROT*2(29=256-227),SEL,ST
(*tempering)=XOR*2.5,CNTB,SUMB,ADD
みたいなことが書いてある
実装してないので抜けや間違いがあると思うが

432 :,,・´∀`・,,)っ-○◎●:2009/03/08(日) 14:59:28
静かになるな
当分はこんなところか

・Cell Speed Challenge参加組
・shinh氏主催のオフ会ネタ
・Cell@ム板スレのみんなで何か作ろうぜ

433 :デフォルトの名無しさん:2009/03/08(日) 15:46:51
作ろうぜってw

実質 PS3 環境で価値のあるものって何かあるか?

434 :,,・´∀`・,,)っ-○◎●:2009/03/08(日) 15:54:41
PS3持ってる人でなおかつLinux入れてる変態専用だからなぁ
その意味じゃGeForceさえ刺さってれば直ぐ試せるCUDAは敷居が低い
にしても
NVIDIA CUDA質問スレッドとくだすれCUDAスレが同時進行してる様は気味が悪かった。

435 :デフォルトの名無しさん:2009/03/08(日) 18:49:50
kikxさんとこのが想像以上に頭良すぎてわろたw
これは勝てないわ

436 :デフォルトの名無しさん:2009/03/08(日) 23:27:43
fixstarsのチュートリアルがつながらんのお

437 :,,・´∀`・,,)っ-●◎○:2009/03/09(月) 00:55:20
> 松本先生の書いたドキュメントを読んでると、状態空間は624ワードじゃなくて623ワード+1ビットであることが分かります。
> これをワード単位に切り上げた実装が624ワードになってるだけです。

32 * 623 + 1 = 19937

438 :デフォルトの名無しさん:2009/03/09(月) 18:31:43
>>376
前スレ1000に "let's transpose!" って書いてある件w

439 :,,・´∀`・,,)っ-○◎●:2009/03/09(月) 19:18:10
>>438
いやそれ以前に俺はbitsliceって単語出してるけどなwww

440 :デフォルトの名無しさん:2009/03/09(月) 21:56:53
っていうか、団子がずっと bitslice に気付いてなかったっぽいのが・・・
自分であんだけ色々弄ってるんだからとっとと気付くだろー、ふつーw

441 :デフォルトの名無しさん:2009/03/11(水) 01:25:49
ひょえー、120倍でも勝てないのかよw

442 :デフォルトの名無しさん:2009/03/11(水) 02:22:18
cell challengeのほうは予選の時点でおそらく220倍ぐらい
いかないと勝てない件

443 :デフォルトの名無しさん:2009/03/11(水) 04:22:07
120倍で勝てないってHack the Cellの話?

444 :デフォルトの名無しさん:2009/03/11(水) 13:01:02
ttp://longlong.way-nifty.com/blog/2009/03/post-7872.html
これじゃね?

445 :,,・´∀`・,,)っ-○◎●:2009/03/11(水) 19:22:12
懇親会の連絡来たお

446 :202:2009/03/12(木) 15:35:12
fixstarsとshin_hさんの、両方参加する。

447 :デフォルトの名無しさん:2009/03/12(木) 15:49:45
これみんな参加するの?正直気が引けるというか・・・

448 :,,・´∀`・,,)っ-○◎●:2009/03/12(木) 22:38:10
フィックスターズさんへ
首都圏限定の懇親会楽しいですか?
次のコンテストから応募要件に「首都圏在住であること」って
入れておけばいいよwww

449 :デフォルトの名無しさん:2009/03/12(木) 23:10:53
地理的にも精神的にもイナカモンなんだな


450 :デフォルトの名無しさん:2009/03/12(木) 23:22:59
優勝して交通費請求すれば出すんじゃね?

451 :デフォルトの名無しさん:2009/03/12(木) 23:53:45
都民にあらずんば人に非ず。

というか、普通に考えたら首都圏在住の人間が一番多くなるんだから当然でしょ。
他にふさわしい所があるってんなら言ってみ?

452 :デフォルトの名無しさん:2009/03/13(金) 00:54:42
沖縄

453 :,,・´∀`・,,)っ-○◎●:2009/03/13(金) 01:03:30
>>450
舐めんな。平日じゃなきゃ、のぞみでも使って自腹で逝ってやんよ


そうだ!関西にLarrabeeトータルソリューションカンパニーの設立を!

454 :,,・´∀`・,,)っ-○◎●:2009/03/13(金) 01:08:19
梅田の空中庭園あたりでなんかやるっていったら集まる奴おるか?

455 :デフォルトの名無しさん:2009/03/13(金) 01:12:27
交通費出してくれたら行ってやるよ

456 :デフォルトの名無しさん:2009/03/13(金) 01:18:57
つまり団子が自費で全国から招集のオフ会でも開くのか?

457 :,,・´∀`・,,)っ-○◎●:2009/03/13(金) 01:26:28
こことかどう?
http://www.gardenfields.jp/isolabella.htm

458 :,,・´∀`・,,)っ-○◎●:2009/03/13(金) 02:02:59
ええわ。誰も来るな。
一人でCUDAまいてやる

459 :デフォルトの名無しさん:2009/03/13(金) 02:23:06
誰が上手い事言えと

460 :デフォルトの名無しさん:2009/03/13(金) 09:59:43
CELLを使った電子会議システムでバーチャル懇親会をやればいい。

461 :デフォルトの名無しさん:2009/03/13(金) 14:51:50
>>448
団子の精神年齢は相当低いなぁ…

462 :デフォルトの名無しさん:2009/03/13(金) 15:52:12
団子の起業フラグだな

463 :デフォルトの名無しさん:2009/03/13(金) 17:59:29
本当に行きたかったらどんなに遠くても行くだろう
まぁ行く気が起きない遠さなのも確かだが

464 :,,  ・´  ∀  `・  ,,)っ-○◎●:2009/03/13(金) 18:06:56
>>463
>>453

465 :デフォルトの名無しさん:2009/03/13(金) 18:44:50
かおでかいよ
てか人集めたいなら休日にやればいいのに

466 :デフォルトの名無しさん:2009/03/13(金) 19:25:04
平日だと何ででれないんだ?
どうせ暇だろ?

467 :,,  ・´  ∀  `・  ,,)っ-○◎●:2009/03/13(金) 19:33:35
暇など無い

468 :デフォルトの名無しさん:2009/03/13(金) 19:59:19
いつものようにインフルエンザのふりしたらいいじゃん

469 :,,  ・´  ∀  `・  ,,)っ-○◎●:2009/03/13(金) 20:01:20
悪いな。今度のプロジェクトは必ず成功させなきゃいけないんだ。

470 :デフォルトの名無しさん:2009/03/13(金) 21:38:13
休日出勤したらいいじゃん。

471 :,,    ・´    ∀    `・    ,,)っ-○◎●:2009/03/13(金) 22:03:54
別にいらねーよ景品なんて

472 :デフォルトの名無しさん:2009/03/13(金) 22:16:36
平日はないよなー。何を思って平日にしたのだか

473 :デフォルトの名無しさん:2009/03/13(金) 22:31:13
そりゃ主催側社員が休日出勤したくないからだろ

474 :デフォルトの名無しさん:2009/03/13(金) 22:33:10
>>469
これは死亡フラグですか?

475 :,,    ・´     ∀     `・    ,,)っ-○◎●:2009/03/13(金) 22:33:18
フィクスタも企業として勉強が必要ですなぁ

476 :,,    ・´     ∀     `・    ,,)っ-○◎●:2009/03/13(金) 22:34:43
>>474
だが、心配のしすぎではないか。

 _/_          |/
  /_  __/- ―‐、 /
  _/ /_/ヽ    _/ |__

  __ / / / ̄//>    _   __/_ ヽ /   __   _/_
    ///   7" /   / /\   /| 三/三     /   /、_
   //|   / /-/_\ /  /  / // | ヽ//  ̄ ̄/ ̄ ̄  / \
 /_,/ \_  ̄ ̄ /__/  \/ _/   / /_/ ヽ    _/     ヽ_

    / ̄ ̄/     // ――     ___   /  ___
  / ̄ ̄/  / ― // ――          / /      /
  / ̄ ̄/  /      /   /   ̄ ̄ヽ   /  \    / ̄ ̄ヽ
 _フ"て_  レ \  /   _/     _/   \_    \   <二/


だけだぜ?

477 :デフォルトの名無しさん:2009/03/13(金) 22:37:57
>>472
休日は場所押さえられなかったとかもありえんじゃね?

478 :デフォルトの名無しさん:2009/03/14(土) 01:16:22
団子は平日無理ならshinhさんの反省会の方でればいんじゃね?

479 :,,    ・´     ∀     `・    ,,)っ-○◎●:2009/03/14(土) 01:23:10
>>478
呼ばれてたけど参加の返事出す前に定員超えちゃったらしくて。

もっとも、メルセンヌツイスタとかの話題なら、全くの素人同士で議論交わすよりも
東広島の某大学にメール投げてたほうが収穫有りそうだし
どのみち話すことはないな。

480 :デフォルトの名無しさん:2009/03/14(土) 01:25:33
レス早いなw
まだ募集してるみたいだぞ。
まあ興味ないなら行かないほうがよいと思うが

481 :,,    ・´     ∀     `・    ,,)っ-○◎●:2009/03/14(土) 01:37:51
松本教授あたりが招かれてるならさすがに逝く価値あると思うが
Cellに特化した話題なら別に興味ないよ。
会場がなぜかFixstarsの本社になってるあたりでテンション下がった。

482 :デフォルトの名無しさん:2009/03/14(土) 11:34:10
平日にしたのは平日にも来られるような現在プーの奴らを安く雇うためでないか?
ただし使えそうな奴限定で。

483 :202:2009/03/14(土) 11:37:46
>>482
東京のIT業界では、平日の7時くらいからいろいろな勉強会、懇親会が各地で
開かれてる。大阪から東京に出てきたクチだけど、この勉強会の多さには驚いた。

まぁ、その前日はLLVM勉強会があったりして、平日の方が多いとは言えないんだけど。

484 :ヽ・´∀・/)っ-●◎○:2009/03/14(土) 11:55:54
げっそり


>>482
shinhさん主催のほうもなぜか会場をFixstarsが提供してるのは
つまりそういうことだろうね

485 :デフォルトの名無しさん:2009/03/14(土) 14:03:18
団子厨はビビってるんだろ?

486 :,,    ・´     ∀     `・    ,,)っ-○◎●:2009/03/14(土) 14:12:50 ?PLT(12022)
そしてリバウンド


こっちだって近場でいろいろセミナーあるからね。
交通費出すのも馬鹿馬鹿しく思えてきた。

487 :デフォルトの名無しさん:2009/03/14(土) 14:42:54
団子さんは大阪かー

488 :デフォルトの名無しさん:2009/03/14(土) 14:43:25
太りすぎだぞ、デブ

489 :227 ◆eZQcaIaFJs :2009/03/14(土) 18:21:18
仕事のプレゼンと被ってしまったんで両方とも不参加です。

アセンブラのスケジューリング+レジスタのカラーリングまで自前で
やっている人が多くて驚いています。今回は完敗ですなぁ。


490 :,,・´∀`・,,)っ-○◎●:2009/03/14(土) 18:33:32
【告知?】
関西慰労会は日本橋のベヒんもスで開催なのは確定的に明らか。

491 :デフォルトの名無しさん:2009/03/14(土) 20:44:12
fixstarsで働きたい輩は参加すべきなのだろうなぁ。やっぱり
でも参加できねぇえええ


492 :デフォルトの名無しさん:2009/03/14(土) 21:07:11
団子さんはintel以外アウトオブ眼中なんで

493 :デフォルトの名無しさん:2009/03/14(土) 21:21:48
インテルハイッテル!
インテルハイッテル!
インテルハイッテル!


494 :,,・´∀`・,,)っ-○◎●:2009/03/15(日) 00:29:11
ネタも尽きてきたことだしこいつで遊ぼうぜ
http://www.kurims.kyoto-u.ac.jp/~ooura/pi_fft-j.html

pi_ca 4194304桁でベンチ

Total 96 sec. (real time), chksum= 14fa @PPE
Total 104 sec. (real time), chksum= 14fa @Atom N270 @1.6GHz

SPEへの移植だけど、スワップするのにDMA使わないと無理だと思うんだ。
でも、DMAが使えなきゃCellを使いこなしたことにはならないんだぜ

495 :デフォルトの名無しさん:2009/03/15(日) 00:41:06
cellスレ的には素敵な燃料投下ね
興味は、ある

496 :デフォルトの名無しさん:2009/03/15(日) 01:29:49
>>490
いや、そことっくに閉店してますしおすし。

497 :デフォルトの名無しさん:2009/03/15(日) 02:01:06
DMAとか面倒くさいですぅ

498 :デフォルトの名無しさん:2009/03/15(日) 10:16:06
fuck the cell 2ch


499 :,,・´∀`・,,)っ-●◎○:2009/03/15(日) 10:23:28
むしろ、なんでI/O禁止だったのか考えてみようぜ。
CellのもっともCellらしいところじゃないか。

(GF拡大体による解法は想定外ということにして)
DMAを使いこなすテクニックより、SIMDレベルでの最適化ができる
人材の発掘を重視したんじゃないかと思うわけで

つまり、フィクスタはCell専業やめようとしてるんじゃないのかと
邪推してしまうんだが

500 :デフォルトの名無しさん:2009/03/15(日) 10:28:45
そういや45nmプロセスの話はどうなったんだろ。

501 :デフォルトの名無しさん:2009/03/15(日) 12:45:06
DMAからむと毎回実行クロック変わるからそれが嫌だったんじゃね?

502 :デフォルトの名無しさん:2009/03/15(日) 15:18:40
敷居を下げて参加を増やすためじゃないんかな
Cell Challengeの方はCell全く知らない人が参加しようと思うと結構面倒だ

503 :デフォルトの名無しさん:2009/03/15(日) 21:30:01
>>499
現時点でのCellに関する知識量に依存しすぎるからだろ。

そんなピンポイントの技術で人材採用してたら、会社続くわけないじゃん。
邪推しすぎ。


504 :デフォルトの名無しさん:2009/03/15(日) 23:34:09
そもそも人材を手に入れるってのが邪推じゃなかろうか

505 :デフォルトの名無しさん:2009/03/16(月) 02:57:33
別に何も意図していなかった、というのはどうだろう?
Cellプログラミングやってる人なら制限付きのお題投げとけばあとは勝手に最適化するよね、と。

506 :デフォルトの名無しさん:2009/03/16(月) 19:11:49
これまで fixstars 知らなかった者としては、売名のためとしか思えんのだがwww

507 :デフォルトの名無しさん:2009/03/16(月) 19:22:28
Cell Challengeそろそろ高速化のネタが尽きてしまった
Hack the Cellに比べると難しいな
1位とかほんとにアルゴリズム一緒なんかと

508 :デフォルトの名無しさん:2009/03/16(月) 19:47:37
予選の結果とか参考にしてどのチームが勝つか予想しようぜ

509 : ◆imos.WO182 :2009/03/16(月) 21:50:27
上位3チームは変わらないようにしか思えない今日この頃だ…
2^34に対してどれくらいのチームが1秒を切れるかが気になるかな
# しかし自分は別の大会の〆切りの方が先なので今はそっちをやっていたり…orz

510 :デフォルトの名無しさん:2009/03/17(火) 02:26:15
上位3チームも速度の傾向違うから違いそうだけども

511 :デフォルトの名無しさん:2009/03/17(火) 14:36:45
上位早すぎて自分早くならなすぎで萎えてきた
自分の能力では張り合えない

Cellアンチになってしまいそうだ

512 :デフォルトの名無しさん:2009/03/18(水) 22:43:51
これって4位以内なら入賞出来るんよね
いけっかな―

513 :デフォルトの名無しさん:2009/03/19(木) 22:15:41
ハックザセルの結果出てる
団子入賞できてないんじゃね?ww

514 :,,    ・´     ∀     `・    ,,)っ-○◎●:2009/03/19(木) 22:31:17
実を言うと、参加資格なくなったんだ
意味解るよな?

515 :デフォルトの名無しさん:2009/03/19(木) 23:04:23
>>514
中の人が増えすぎた?

516 :デフォルトの名無しさん:2009/03/19(木) 23:05:33
あまりCellの悪口を書けなくなったのかよw

517 :,,    ・´     ∀     `・    ,,)っ-○◎●:2009/03/19(木) 23:11:06
というのは冗談で、トップ争い馬鹿馬鹿しくなって匙投げた。
仮に優勝してもテレビとPS3程度じゃ馬鹿馬鹿しいだろうと思った。

いや、たとえばの話だよ。
某GPUメーカーが、Tesla搭載のXeon DP機を無償提供してくれる
とかいう美味しいシチュエーションになってみろよ。
いちいちPS3 2台目狙いの商品レースなんて馬鹿馬鹿しくなるだろ

・・・いや、あくまでたとえ話だよ。実際そうだなんて言ってないんだからね><


もちろん中の人に干渉されるのは嫌いですよ。

ええ、 『あ な た』 のことです。

518 :227 ◆eZQcaIaFJs :2009/03/19(木) 23:20:09
ttp://www.jagoon.com/temp/htc2009.zip

またもや仕事のプレゼンが伸びちゃったし、これからどーなるんだろ…。
三連休はSO4で現実逃避の予定が、金土出勤と言う事になってしもうた。

っgenrand_mine(0);


519 :,,・´∀`・,,)っ-○◎●:2009/03/19(木) 23:26:28
Wiiタクティクスオウガの死者の宮殿ばっかしやってましたよ

520 :デフォルトの名無しさん:2009/03/19(木) 23:31:51
hack the cellの結果、70倍と90倍の間に壁があるな。
そこがトランザムの壁か?

521 :デフォルトの名無しさん:2009/03/19(木) 23:43:18
CellよりGPUのほうが効率いいんじゃないの?

522 :,,・´∀`・,,)っ-●◎○:2009/03/19(木) 23:46:59
もちろんCUDAのMTのサンプルほぼそのまんまで菊やん氏のコード超えると思うよ。
まだ試してないけどCore 2/i7だと150倍相当いくんじゃないかと思う


523 :デフォルトの名無しさん:2009/03/19(木) 23:51:42
しかもそのCUDAすら団子さんの本命じゃないんだよね
cellに興味持てなくて当然だね

524 :,,・´∀`・,,)っ-●◎○:2009/03/20(金) 00:02:01
いや、いかなる条件でも最善を尽くすのがプロでしょ。
俺は選り好みしたがる時点で負けてるよ。


525 :デフォルトの名無しさん:2009/03/20(金) 00:19:01
つか、総評とかコンテストレポートって出ないの?
どっかに出てるけど俺が見落してるだけ?

1位2位は単純に速度で優劣つくから納得だろうけど
ふぃくすた賞選別とかは流石に釈明が必要だと思うんだが。

526 :デフォルトの名無しさん:2009/03/20(金) 00:31:17
なんかみんなすげーわ。
プログラムの書き方が根本的に違う。
つかプログラムに見えないwww

527 :,,・´∀`・,,)っ-●◎○:2009/03/20(金) 00:41:49
>>525
所詮学生主体のコンテストだからなって妙に納得したけど

528 :デフォルトの名無しさん:2009/03/20(金) 00:45:07
社会人凄いなぁ。学生と比べると圧倒的じゃないか
学生でトランザムっぽいのは一人だけか・・。

529 :,,・´∀`・,,)っ-●◎○:2009/03/20(金) 00:46:49
来年あったら放送大学の学生として参加しようかなwww

530 :デフォルトの名無しさん:2009/03/20(金) 01:28:13
SPE1基で120倍ってことは6基使ったら720倍か・・・

531 :,,・´∀`・,,)っ-●◎○:2009/03/20(金) 01:36:31
ならねーよ。
状態に依存関係があるし

532 :デフォルトの名無しさん:2009/03/20(金) 01:52:59
うむ、「1/6の稼働で120倍」と言えば嘘じゃない。

533 :デフォルトの名無しさん:2009/03/20(金) 09:46:12
学生部門の課題提出者は16人か
少ないなぁ。スピードチャレンジもあったしなー

534 :デフォルトの名無しさん:2009/03/20(金) 09:55:34
終わってみれば >>5 がビンゴな件

535 :デフォルトの名無しさん:2009/03/20(金) 10:02:03
正直最後までインラインアセンブリの使い方わかんなかったよ
ていうかまじめに調べてなかったけど。

536 :202:2009/03/20(金) 15:07:13
>>535
つttp://dsas.blog.klab.org/archives/51389200.html

537 :デフォルトの名無しさん:2009/03/20(金) 16:31:46
団子イタイなぁ…

538 :,,・´∀`・,,)っ-○◎●:2009/03/20(金) 16:37:26
うん、いたいよ。

539 :,,・´∀`・,,)っ-○◎●:2009/03/20(金) 16:53:28
>>536
なるほど、KLabの人だったのか

540 :デフォルトの名無しさん:2009/03/20(金) 17:06:43
んで、団子は何倍出たんだい?

541 :,,・´∀`・,,)っ-○◎●:2009/03/20(金) 17:09:30
bitsliceで100倍まではいけたけど、提出したのは従来の方策。

542 :デフォルトの名無しさん:2009/03/20(金) 17:10:27
ああ、やっぱり100倍は越えれたのか

543 :,,・´∀`・,,)っ-○◎●:2009/03/20(金) 17:40:04
(笑)

544 :デフォルトの名無しさん:2009/03/20(金) 20:01:09
bitsliceなんていう手法があったのですね・・・!!

545 :デフォルトの名無しさん:2009/03/20(金) 20:06:38
なんかfixstarsの結果発表あっさりしすぎてるな
なんかこう、、、ないの?
なんのためにやったんだこれ?

546 :デフォルトの名無しさん:2009/03/20(金) 20:42:26
>>545
自分はなんのためにやったの?

547 :デフォルトの名無しさん:2009/03/20(金) 21:43:31
フィクスターズ賞は何が決め手だ?

548 :,,・´∀`・,,)っ-○◎●:2009/03/20(金) 22:02:01


549 :デフォルトの名無しさん:2009/03/20(金) 22:11:02
アッー!

550 :デフォルトの名無しさん:2009/03/20(金) 22:12:09
気になるなら来週のMT勉強会に出る人に聞いてもらえば

551 :デフォルトの名無しさん:2009/03/20(金) 23:08:05
>>548>>549
枕?アッー?

>>550
みんなブログにいろいろ書いてくれればおk

552 :,,・´∀`・,,)っ-○◎●:2009/03/20(金) 23:34:32
別にMTの高速化方法なんて無駄知識なんだしいちいち拘ったって意味ないぜ
来年同じ問題が出る訳じゃ有るまいし。

まあ、x86バイナリアンが上位に残ってるのは感慨深いね。
職業Cellプログラマってそんなに居ないのかな?

553 :デフォルトの名無しさん:2009/03/20(金) 23:37:45
ゲーム屋以外にどこにいるんだ?w
ゲーム屋もミドルウェア買ってるところはSPUあんまり叩かないんじゃないか?

554 :,,・´∀`・,,)っ-○◎●:2009/03/20(金) 23:48:45
上位者にゲーム屋は(ほとんど?)居ないっぽい

555 :デフォルトの名無しさん:2009/03/21(土) 00:03:19
レポートは後で公開されるみたいだね。
まずはとりあえず結果とソースだけって感じか。

556 :デフォルトの名無しさん:2009/03/21(土) 00:09:35
表彰式はやらないのかな

557 :デフォルトの名無しさん:2009/03/21(土) 00:14:49
>>556
勉強会に優勝者くるっぽいから参加者で表彰してあげればいいんじゃね?


558 :デフォルトの名無しさん:2009/03/21(土) 00:17:00
準優勝の人がキャメロットのプログラマだね。
Cellのコンテストなのに任天堂系の開発会社の人が入賞してるところがなんともw
任天堂的には良い宣伝になりそう。
ゲハネタにももってこいだなw

559 :,,・´∀`・,,)っ-○◎●:2009/03/21(土) 00:19:57
キャメロットはみんごる5なんかも開発してるぞ

560 :,,・´∀`・,,)っ-○◎●:2009/03/21(土) 00:25:08
すまん違ったわ。
いま開発してるのはキャメロットから独立したクラップハンズって会社だね。

561 :デフォルトの名無しさん:2009/03/21(土) 00:27:39
みんゴル5はクラップハンズだよ
キャメロットは初代みんゴル
公開情報を見る限り、最近はPSの仕事はしてないはず

562 :デフォルトの名無しさん:2009/03/21(土) 00:29:20
SCEはこの結果を見て歯ぎしりしてるかもw
また一つネタが増えたね

563 :,,・´∀`・,,)っ-○◎●:2009/03/21(土) 00:36:08
っていうかむしろSCEは参加禁止なんじゃないの?

564 :デフォルトの名無しさん:2009/03/21(土) 00:39:31
Fixstars社員じゃないから応募は可能

565 :227 ◆eZQcaIaFJs :2009/03/21(土) 01:16:38
今日はビルド待ち時間に入賞者のコード見てニヤニヤしてましたが、
両パイプライン埋めただけじゃ歯が立たないと言うことを痛感してます。

>>554
ゲーム屋(今はDirectXで3D)ですが、仕事でCell触ったことは有りません。


566 :デフォルトの名無しさん:2009/03/21(土) 12:20:36
なんというゲハ脳。
業務上 Cell を扱った事のある人は、守秘義務契約上
参加出来ない、或いは非常に参加しにくいのは当たり前。

567 :,,・´∀`・,,)っ-●◎○:2009/03/21(土) 12:32:51
ま、テクニックを不特定多数に公開することになるから、そう言う意味ではまずいかもしれんね。
まあ、連中の実力も大したことはなさそうだが。

568 :デフォルトの名無しさん:2009/03/21(土) 12:39:53
最後の一行が余計だよ

569 :デフォルトの名無しさん:2009/03/21(土) 13:34:29
SPU一個のDMAなしでしょ?
ゲームやさんはタスク並列にチャレンジしてるわけだし
その先に行ってると思うけどな。
むしろタスク並列やっていたらあんまりタスク内の最適化は
しないかもね。
ボトルネックにならない限りやっても意味ないことが多いだろうし。

570 :,,・´∀`・,,)っ-●◎○:2009/03/21(土) 15:42:32
んなこと言うならSPE6コア全部使って200倍でも出して見やがれですぅ

571 :,,・´∀`・,,)っ-●◎○:2009/03/21(土) 16:05:02
俺もその方法ちょっと考えてみたんだけどね。
全部同じmt[]に対してまったく同じ更新処理をする。
んで、tempering + sumだけを分担して処理する。

N = 624だから104ずつで並列化できるでしょ

わざわざDMA使ってMTの状態をコピーするくらいなら
それぞれで独自にテーブル持ったほうが速いんじゃないかって思ったんだ

あ、もっといい方法があるなら指摘ヨロ


572 :デフォルトの名無しさん:2009/03/21(土) 17:12:22
>>571
使用目的にもよるけど、それぞれ違う初期値で別々に動かせばいいんじゃない?
そうすればSPEの数に合わせてリニアに性能伸びるよ

573 : ◆imos.WO182 :2009/03/21(土) 17:18:26
新しく組んだプログラムのバグが直らず前のままですたorz
縦方向で各マス2ビットを用いた方法を使ったんだけどなー…うーむ

574 :デフォルトの名無しさん:2009/03/21(土) 17:26:15
今年のCell Challengeの問題はデバッグが大変だったな

局所的に何か間違った結果が出ていても計算結果の距離は合ってたりするから困る
練習問題と予選問題だけではバグが取りきれない

575 :,,・´∀`・,,)っ-○◎●:2009/03/21(土) 17:27:55
うーん、斜め上の回答ありがとう。
「同じチェックサムになるような疑似乱数を生成する」って縛りがなければ
ハッキリ言ってなんでも出来るだろ。

576 :デフォルトの名無しさん:2009/03/21(土) 17:38:44
問題設定自体に現実味が無いな

それと違う初期値で別々に動かすのは乱数が被ることもあるからNG

577 :572:2009/03/21(土) 17:53:09
>>576
だから「使用目的にもよるけど」って書いてあるだろ。

578 :,,    ・´    ∀    `・    ,,)っ-●◎○:2009/03/21(土) 19:00:02
意味なくね?

579 :デフォルトの名無しさん:2009/03/21(土) 21:55:07
mtの更新については、累積変換行列をひとつ用意しておけば
ワープは比較的容易じゃないかなぁ。で、各SPUに時間差を
付けた集計を割り当てておいて最後に足すと。どの位の単位で
割るかや、勿論にテストケースにもよりますが、SPU数分-α
位の倍率はそんなに非現実的でも無い様な気はします。気が
するだけだけど。

580 :,,    ・´    ∀    `・    ,,)っ-●◎○:2009/03/21(土) 22:16:53
>累積変換行列
どのくらいの規模になるんかね?
HDDにスワップするような規模なら本末転倒だが

581 :デフォルトの名無しさん:2009/03/21(土) 22:17:23
つか並列は可能。
SPU単位でも、8並列すればselbを追放できる。
そうすればODD側がネックになってくるけどな。

582 :デフォルトの名無しさん:2009/03/21(土) 22:18:28
>>580
大きく見積もっても32*19937bitじゃないかな。

583 :,,・´∀`・,,)っ-○◎●:2009/03/21(土) 22:23:59
行列うpきぼんぬ

584 :デフォルトの名無しさん:2009/03/21(土) 22:46:00
やっぱり目的は乱数の発生じゃなくてチェックサムの計算なのかw

585 :,,・´∀`・,,)っ-○◎●:2009/03/21(土) 22:53:37
pmt(笑)は結局無かったことですか?

586 :デフォルトの名無しさん:2009/03/21(土) 23:25:05
前出の人の話は私もわかっていませんよ。
mt の更新は本当に線形変換するだけなので、
出来ると思いますが…ちょっと実装してみますが
それなりに手間かかるかも。

587 :デフォルトの名無しさん:2009/03/21(土) 23:54:22
>569 に対する >570 がおかしいでしょ。

588 :デフォルトの名無しさん:2009/03/22(日) 00:06:34
>>573
それってバグ直れば上位に匹敵するタイムを出せる方法?

589 :,,    ・´    ∀    `・    ,,)っ-●◎○:2009/03/22(日) 00:53:22
>>587
ごめんね。

いや、要するにさ、経験がないことを言い訳にしてるんだよね。

そりゃ詭弁だぜ
今回のコンテストで初めてCellに触った人すら上位に入ってるわけで。

まあなんにせよCellプログラミングの経験を重ねた人間よりも
地頭のある人間を選別するテストとしては、Fixstarsの今回の課題は有効だったわけだ。



590 :デフォルトの名無しさん:2009/03/22(日) 02:12:10
>>583
http://longlong.way-nifty.com/blog/2009/03/post-fb6a.html
こんな感じでどうでしょうか?

591 :,,・´∀`・,,)っ-○◎●:2009/03/22(日) 02:22:17
このスレ監視されすぎです
KOEEEEEEEEEEEEEEE

592 :デフォルトの名無しさん:2009/03/22(日) 02:38:27
実力ある人は実に謙虚だ

593 :,,・´∀`・,,)っ-○◎●:2009/03/22(日) 03:04:57
>>592
だんごやさんから傲慢とったら何も残りませんよ

594 :デフォルトの名無しさん:2009/03/22(日) 09:19:08
>>591
mjd?

595 :デフォルトの名無しさん:2009/03/23(月) 08:42:43
Cell Challenge予選1位のチームの戦略
ttp://mono.kmc.gr.jp/~oxy/d/?date=20090323

300倍とか凄すぎる
スライド見ると彼ここ見てたのが分かるw

596 :デフォルトの名無しさん:2009/03/23(月) 11:36:08
じゃあCELL2になったら1/4時間でエンコ終了するのか

597 :デフォルトの名無しさん:2009/03/23(月) 17:55:31
いいこと考えた
SPEベースに普通のCPU作ったら良いじゃん

598 :,,    ・´    ∀    `・    ,,)っ-●◎○:2009/03/23(月) 18:52:55
なんだ、ただの神か

# 京大マイコンクラブってよく名前聞くよな

599 :デフォルトの名無しさん:2009/03/23(月) 19:19:28
>>597
Spursエンジンですね。わかります。

600 :デフォルトの名無しさん:2009/03/23(月) 21:41:48
あれだけ偉そうなこと書いてるくせに
KMC知らないとか…

601 :,,・´∀`・,,)っ 【dango:0】 :2009/03/23(月) 22:25:00
なにをおっしゃいますやら
PLAMOが初めて使ったLinuxディストロですよ。
例の本の初版も持ってましたよ。こじまみつひろ氏ね。

602 :デフォルトの名無しさん:2009/03/23(月) 22:26:10
一瞬殺人予告にみえた。Orz

603 :デフォルトの名無しさん:2009/03/23(月) 23:55:18
Plamoとか東広島ネタとかやめてくれw
自分が書き込んだかと錯覚してしまう

604 :デフォルトの名無しさん:2009/03/24(火) 03:40:34
>>601
> 例の本の初版も持ってましたよ。こじまみつひろ氏ね。
なんぞ恨みでもあるのか?氏ねなんて・・・。

605 :デフォルトの名無しさん:2009/03/24(火) 04:45:54
それはさすがに2ch語に毒されすぎだ


606 :デフォルトの名無しさん:2009/03/24(火) 19:28:04
最近ぬるぽしても叩かれないから淋しい

607 :デフォルトの名無しさん:2009/03/25(水) 04:47:08
>>606
ガッ

126 KB
■ このスレッドは過去ログ倉庫に格納されています

★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50

read.cgi ver 05.04.00 2017/10/04 Walang Kapalit ★
FOX ★ DSO(Dynamic Shared Object)