E D R , A S I H C RSS

AMD FX 시리즈

No older revisions available

No older revisions available




이 FX 계열에서 새로 나오는 아키텍처는 이제 서버와 데스크탑 주력 제품군, APU에까지 폭넓게 쓰이고 있으므로, 그 아키텍처들에 대한 설명도 편의상 모두 이곳에 정리해 두도록 합시다. AMD의 새로운 씨피유들의 아키텍처가 FX 시리즈에 쓰이는 것이라면, 그 정보를 여기에 추가하고, 링크도 여기에 걸어주세요.

Contents

1. 개요
2. K8 아키텍처
3. K8 이후 시리즈
3.1. 아키텍처
3.1.1. 왜 하나의 부동 소숫점 연산 장치를 가졌나?
3.1.2. 1 모듈은 몇 개의 코어인가
3.2. 잠베지(불도저 아키텍처)
3.2.1. 성능
3.2.2. 문제점
3.2.3. 이런 저런 이야기
3.2.4. 제품 정보
3.3.라(파일드라이버 아키텍처)
3.3.1. 향상점
3.3.2. 문제점
3.3.3. 이것 저것
3.3.4. 제품 정보
3.4. 스팀롤러 아키텍처
3.5. 엑스카베이터 아키텍처
3.5.1. FX라인과 일부 옵테론 라인의 모듈 구조의 개선 포기
4. 같이 보기


1. 개요

AMD에서 만든 최상위 현실은 시궁창 데스크탑 CPU 제품군.

2. K8 아키텍처

© from

당시의 CPU 로고. 이때의 명칭은 '애슬론64 FX' 였다.

AMD가 한창 인텔을 발열과 성능으로 잡던 때 만들어진 애슬론64 시리즈의 상위 제품군명. K8 아키텍처를 기반으로 하고 있다. 싱글코어 130nm SOI 슬렛지해머, 크로우해머, 90nm SOI 샌디에고가 있으며 듀얼코어 90nm 톨레도, 윈저가 있다. 인텔이 넷버스트 아키텍쳐로 삽질하고 있을적 에는 따라올 자가 없는 성능을 가지고 있었지만, 콘로나오면서...

3. K8 이후 시리즈

K8 아키텍처 시절 이후 없던 FX 시리즈는 2011년 불도저 아키텍처를 사용한 새로운 FX 시리즈가 나오면서 부활하게 되었다

3.1. 아키텍처

K8 이후 나온 FX 씨피유들의 아키텍처는, 모듈 구조라고 불리는 새로운 아키텍처를 쓰고 있다. 이전까지의 AMD 씨피유들의 구조와는 달리. 밑바닥부터 재설계된 새로운 구조를 사용하고 있다. 또한, FX 씨피유의 설계에 쓰인 아키텍처는, AMD의 APU에도 적용되고 있어서, 실질적으로 이 새로운 아키텍처는 AMD의 메인스트림 씨피유의 핵심이라고 할 수 있다. 대략적 개념도는 아래와 같다.(아래는 불도저의 것을 기반으로 한다.)


하나의 모듈에는 두 개의 정수 연산 장치와 한 개의 부동 소숫점 연산 장치가 들어있다. 전통적인 코어라는 개념에서의 씨피유들이 한 개의 코어 안에 한 개의 정수 연산 장치와 한 개의 부동 소숫점 연산 장치를 가진 것과 비교하면, 모듈은 약간 독특한 구조인 것이다. 모듈 구조가 나온 것은 전력/트렌지스터 수 대비 성능 때문이다. 단일 코어 구조에서 클럭을 무작정 높이거나 트렌지스터를 아주 많이 넣어서 비대해진다고 해도, 소모되는 전력이나 들어가는 트렌지스터의 양에 비하면 성능 향상은 적다. 그래서 코어를 여러 개 가진 씨피유가 등장한 것인데, AMD는 여기서 더 나아가서, 각 코어 사이에서 공유해도 성능 저하가 적은 부분들을 서로 공유하도록 설계해서, 소모 전력과 트렌지스터를 상대적으로 적게 늘리면서도 다중 코어로 성능을 많이 끌어올리는 설계를 한 것이다.

3.1.1. 왜 하나의 부동 소숫점 연산 장치를 가졌나?

두 개의 정수 연산장치가 한 개의 부동 소숫점 연산 장치를 가지게 되면, 필연적으로 정수 연산장치 당 부동 소숫점 연산 성능은 약간 떨어지게 된다. 그럼에도 AMD가 이러한 구조를 택한 것은 아래와 같은 이유 때문이었다. 첫째, 평소에는 잘 쓰이지 않는(게임이나 과학 계산 등이 아닌, 일반적인 경우 이것은 사실이다) 부동 소숫점 연산 장치의 개수를 줄이고, 그 남는 자리에 정수 연산 장치를 늘림으로서, 보다 많은 정수 연산장치가 가져오는 총 성능 향상을 노렸다. 두번째로, 두 개의 FPU(부동 소숫점 연산 장치)가 들어갈 자리에 1 개의 FPU만 넣게 되면, 분명히 2개의 FPU보다는 자리를 좀 더 적게 차지하면서도, 고급 부동 소숫점 연산 명령어를 많이 가진 FPU를 넣을 수 있게 되는 것이다. 그런데 6000, 8000 시리즈는 가격대상 이런 고급 계산이 많이 필요한 사람들이 구입하는 물건이라는 게 함정.
근데 이 공유 FPU의 성능이 인텔의 각각 코어에 따로 들어가는 FPU보다 딸린다는 주장이 있다. 게다가 FPU를 한 쓰레드에서만 쓰는 경우에도 두 쓰레드에서 공유하는 것처럼 동작(결국 나머지 쓰지 않는 절반은 놀게 된다)한다는 의혹도 나온적이 있다. 사실이라면 그저 안습

3.1.2. 1 모듈은 몇 개의 코어인가

코어의 정의에 따라서 갈린다. 기존의 일반 사용자용 CPU의 코어를 세는 방식대로라면 FPU 뿐만 아니라 명령의 해석과 발행을 전담하는 프론트엔드까지 전부 공유하고 있으므로 1개의 코어로 보아야 하고, 각자 제각기 독립된 자원을 갖고 운용된다는 부분을 감안하여 코어를 정의한다면 2개의 코어로 볼 수 있다.(이런 식으로 셈하는 대표적인 예가 UltraSparc T시리즈.)

3.2. 잠베지(불도저 아키텍처)

불도저 아키텍처는 본래 적어도 2011년 2분기 전까진 나올 예정이였지만, AMD曰, 만족할 만한 성능이 나오지 않는다고 해서 연기(延期)에 연기를 거듭해 2011년 10월 12일로 발매가 결정되었다. nVIDIA 에서도 개발중 꽤 괜찮을 것이라고 생각했는지, 불도저 지원 칩셋인 990FX 에 SLI 라이센스를 넣어주기도 했었다.


3.2.1. 성능

AMD가 자신 만만하게 개발을 발표하고 언론에서도 샌디브릿지 킬러가 될 거라고 해서 많은 사람들을 기대하게 만들었다. 다만, 기다림의 시간과는 달리 2600K는 커녕 2500K의 성능에도 한참 못 미치게 만들어서 많은 사람들을 실망하게 만들었고, 심지어 페넘 II 1100T BE 의 클럭당 성능보다 성능이 떨어져서 많은 사람들을 실망하게 만들었다. 심지어 팀킬을 당하는 상황까지.

리뷰어 曰, "실 사용 성능 및 Synthetic 벤치마크 결과는 투반을 앞서지만, 순수 연산 성능이 투반에 뒤져 당혹스럽습니다.".. 이쯤되면 정말 할말이 없다. #


CPU의 멀티스레드 렌더링 능력을 측정하는 시네벤치를 돌려보면 옥타코어 제품군인 FX 81XX 제품군이 동클럭에서 인텔의 2500K나 3570K와 비슷한 점수를 뽑아내긴 한다. 옥타코어가 쿼드코어와 대등하게 놀고 있다는 것만 제외하면 가격대도 비슷하니 큰 문제는 없다. 그러나 하이퍼스레드가 적용된 2600K나 3770K 이상 CPU 상대라면 진퉁 8코어 CPU가 8코어 흉내내는 4코어 8스레드 CPU에게 처참히 찢겨버리는 광경을 보여주는데, 어찌됐건 가격 경쟁력을 내세우며 힘겹게 버티고 있다. 1만원당 성능비라는 해괴한 그래프까지 내세운 처절한 홍보.
그리고 이젠 듀얼코어와 가격 경쟁을 한다. 하단부 참조.
결국 경이로운 1만원당 성능비 달성에 성공했다. 웃어야할지 울어야할지


이 때문에 생긴 별명이 불도좆.

한편 극렬 암드빠들은 어떻게든 실드를 치려고 FX8150는 쿨러 바꾸고 4.6Ghz로 오버클럭 하면 i7-3770보다 성능이 높아지니 우월하다고 주장하고 있다.(...) i7도 쿨러 바꾸고 오버클럭 할 수 있는데 그리고 배수락 해제 버전(K버전)하고 인텔 터보부스트는 장식인가왜 소비전력,발열도 3770보다 안좋은 쪽으로우월한 말이 없지

3.2.2. 문제점

AMD 불도저 아키텍처는 코어 개개의 정수유닛의 수가 적기에, 이로 인해 코어당 IPC의 저하가 생겼고, 이것을 클럭을 늘려 커버하기 위해 파이프라인의 스테이지를 늘렸는데, (투반: 14스테이지, 코어당 3개, 불도저: 18스테이지, 코어당 2개) 깊은 파이프라인은 분기 예측[1]의 성능이 떨어지면 성능의 저하가 더욱 심해진다. 무슨 말 이냐면, 분기예측은 예측을 실패하게 되면 해당 파이프라인을 싹 비우고 계산을 처음부터 다시 시작해야 하는데, 투반에서는 실패할 경우 14단계를 밟아서 다시 계산하는 반면에 불도저는 18단계를 밟아서 다시 계산하게 된다.[2]

즉 넷버스트 아키텍처의 펜티엄 4 프레스캇의 재림(···). 당시 인텔은 P6보다 노스우드의 파이프라인을 얇게 하는 대신 파이프라인 스테이지를 늘리어 클럭을 더 늘리고 보다 프레스캇에는 노스우드보다 스테이지를 더 늘렸다. 결과는? 지금의 FX 시리즈와 같다. 이전 아키텍처에 비하여 불도저의 파이프라인 스테이지 수가 늘어났다지만 윌라멧(28)이나 프레스캇(39) 정도의 막장은 아니며, 인텔 네할렘 마이크로아키텍처나 샌디브릿지와 비슷한 수준(16~19스테이지 정도)이다. 다만 AMD쪽 아키텍처에서는 인텔에는 있는 µop캐시[3]#가 없기때문에 분기예측에 실패하면 더 많은 단계를 거쳐야 한다. #[4]

불도저의 슈퍼파이 결과는 20초가 아주 조금 안되는 결과를 보여주는데, 불도져 FPU활용의 비 효율성을 극명하게 보여준다. 지금까지 밝혀진 벤치마크들로는 불도저의 FPU가 1모듈의 2개 논리스레드로 모두 작업할 때와 1개 논리스레드만 작업할 때의 성능이 2배로 차이나는데, 쉽게 말해서 불도저의 공유된 FPU는 현재 한쪽 코어가 FPU를 쓸 일이 없어도 반절의 시간은 그냥 쉬어버린다는 소리다. 그리고 슈퍼 파이는 아직 멀티코어에 맞는 개선이 이루어지지 않았기에 단일 코어만을 쓴다. 이것을 감안해본다면, 분명히 불도저의 FPU 한 개의 전체 성능은 인텔의 최신 샌디브릿지와 아이비브릿지의 FPU 한개의 성능에 근소한 차이로 근접한다는 의미(FPU의 모든 기능에 대한 비교는 아닐지라도에, 최소한 슈퍼파이가 주로 사용하는 명령어이자 FPU의 가장 기본적인 명령어인 x87 부동 소숫점 명령어들의 성능에 대해서)인데, 멀쩡히 달린 FPU도 제대로 활용하지 못하는 것은 그야말로 절망의 끝을 달린다고 할 수 있다.

또한 불도저의 트랜지스터 수는 연산 능력으로 비교하자면 아이비브릿지나 샌디브릿지 등의 씨피유들과 비교해서, 더 많은 코어 수와 넉넉한(지금으로선 쓸모없는데 잔뜩 넣어서 전기 먹고 열낸다고 욕만 먹는)캐시메모리의 양을 감안해 보더라도 적다고 말하기가 힘든 수준이어서,[5] 구조의 효율성에 문제가 있다고 이야기되고있다.

그리고 이것 또한 상당히 뼈아픈 문제점인데, 과거 애슬론64시절을 일궈낸 핵심개발인력들이 전임 CEO Dirk Meyer 에 의해서 회사를 떠났고, 이와 함께 그의 방식대로 자동화설계로 전환되었는데, 인력에 의한 세밀한 조정작업을 거치지 못한 덕에 앞서 언급한 다소 비효율적인 구조를 가지게 되었다.

다만 x264 인코딩이나 압축 등 일부 분야에서는 인텔에 비해 크게 밀리지 않는 성능을 보여주기도 한다. #

3.2.3. 이런 저런 이야기

절망적인 결과의 6페이지짜리 개인 리뷰가 나왔는데, 2011년 12월 9일 확인결과 댓글이 1개있다.. #

씨피유 지원상의 문제로 특정 게임에서 블루스크린을 띄우고 뻗기도 했다.확인사살 다만 윈도우 핫픽스로 해결된 상태.

설문조사 결과 비호감 1위가 국회의원을 제치고 1위를 차지했다! 그야말로 절망의 끝을 달린다.

AMD본사에서 직접 진행한 FX 오버클럭에서 세계 신기록을 달성하였다. 8.429 GHz을 찍으면서 기존 최고 기록인 8.308 GHz 를 깨뜨렸다.

그나마 희망은 차세대 게임기의 CPU 탑재에는 가능성이 꽤 있다는 것이다. 물론, APU로 결정날 가능성이 높지만. 결국 PS4에는 재규어 기반의 APU가 채용되었으며, 차세대 Xbox One에도 재규어 기반의 APU가 채용되었다. 재규어가 AMD 제품이라는 게 그나마 다행. (재규어는 아래 언급할 비쉐라와 비슷한 세대 제품이지만 저전력 저성능 제품이다. 인텔로 치자면 아톰 계열의 넷북~테블릿용 CPU)

8120이 12만원에 덤핑되어 팔리는 굴욕을 겪었으며, 덕분에 6100의 위치는 더욱 애매해져 암드 팀킬의 역사를 이어갔고 i3에 대한 가격 경쟁력을 확보하여 AMD의 명줄을 늘리는데 기여했다. 듀얼코어와 옥타코어가 같은 가격으로 팔리는 것은 그저 눈물만

3.2.4. 제품 정보

제조 공정 : 32nm SOI
소켓 : AM3+(바이오스 업데이트가 가능하다면 AM3 계열 메인보드도 가능)
칩셋 : 9xx계열(바이오스 업데이트가 가능하다면 더 하위의 칩셋도 가능)
전 기종 배수락 해제, 오버클럭 가능

제품명 모듈/코어 기본클럭/터보클럭 L2캐시 L3캐시 열설계전력
FX8150 4/8 3.6GHz/4.2GHz 2 * 4MB 8MB 125W
FX8120 4/8 3.1GHz/4.0GHz 2 * 4MB 8MB 125W/95W
FX8100 4/8 3.1GHz/3.7GHz 2 * 4MB 8MB 95W
FX6200 3/6 3.8GHz/4.1GHz 2 * 3MB 8MB 125W
FX6100 3/6 3.3GHz/3.9GHz 2 * 3MB 8MB 95W
FX4170 2/4 4.2GHz/4.3GHz 2 * 2MB 8MB 125W
FX4130 2/4 3.8GHz/3.9GHz 2 * 2MB 4MB 125W
FX4100 2/4 3.6GHz/3.8GHz 2 * 2MB 8MB 95W

3.3. 라(파일드라이버 아키텍처)

2012년 3분기 발매가 예정되어 있던 비[6]는 한 차례의 발매 연기를 거치고 2012년 10월 발매되었다. 신규 메인보드 칩셋 없이 AMD의 기존 9xx계열 메인보드의 칩셋을 그대로 사용하며(여기에는 AMD의 극심한 재고와 여유가 없는 자금사정이 커다란 이유가 되었다.) 기존의 9xx계열 칩셋 메인보드들은 바이오스 업데이트만으로 이 신형 씨피유를 온전히 지원할 수 있고, 하위 칩셋들도 바이오스 업데이트로 지원 가능할 것으로 보인다[7]. 불도저의 고가 정책이 인텔에 비해 경쟁이 힘든 성능으로 인해 저조한 판매고를 보인 것을 감안해서인지, 비세라의 AMD 초기 공지 시가는 최고위 모델조차 199달러를 기록하는 대단히 공격적인 모습을 보여주고 있다.
딱히 큰 의미는 없지만, 컨슈머용 데스크탑 프로세서 중 처음으로 스톡 클럭 4GHz를 넘은 제품군이다.[8]

3.3.1. 향상점

불도저 아키텍처에서 클럭 당 명령어 성능을 개선하고, 공진 클럭 메시 기술을 적용해서 전력 대비 클럭을 개선하고, 그것에 기반해 같은 전력에서의 클럭을 끌어올리고, 전력 대비 성능이 개선되었다. 최고위 모델의 경우, 기본 클럭만 4기가헤르츠를 보여주며, AMD가 말한 세대 당 10~15퍼센트의 성능 향상은 지켜졌다. 비록 클럭 당 명령어 처리 능력은 소수의 몇몇을 제외하고 거의 향상이 없지만, 불도저 대비 같은 전력으로도 더 늘어난 클럭으로 인해 성능의 향상은 어느정도 있다.

단일 스레드 처리의 경우에는 인텔 팬티엄모델에게도 패배하지만. 다중 스레드 작업의 경우, 경우에 따라서는 i5 4세대조차도 넘어서는 모습을 보여주고 있다. 그러니, 이 세대에 들어서는 어쨌든 2세대 전 제품인 투반에게는 단일코어던 멀티코어던 확실히 이기고는 있다.[9]

물론 워드프로세서도 멀티코어를 지원하는 시대에 단일 코어로의 비교는 유의미한 결과는 아니다.
다만 아직까지 옥타코어를 지원하는 소프트웨어가 많지 않다는 점을 유념하면 구매할 때 자신의 용도에 따라 어떤 CPU를 고를 지 좋은 참조가 될 것이다.

2015년 현재 출시된 최신 패키지 게임들의 경우는 멀티코어는 당연히 지원하고, 대다수가 옥타코어도 지원하고 있으며, 옥타코어 지원게임의 경우는 i7 샌디브릿지와 비교해도 프레임이 크게 떨어지지 않고, 가격은 i3 급 수준이니 패키지 게임을 주로하는 유저라면 저렴하게 게이밍 머신을 맞추는데는 비쉐라 FX8300 만한것도 없다.

3.3.2. 문제점

비록 다양한 종류의 정수 연산에서 성능 향상이 있고, 다양한 고급 부동 소숫점 연산에서도 성능 향상이 있지만, 이상하게도 수퍼파이 연산에서는 클럭 향상 만큼의 연산 성능 증가도 보여주지 못하고 있다. 이는 수퍼파이가 매우 오래된 x87명령어셋을 사용하는 것에도 기인한다. 참고로 이 명령어셋은 8086시절부터 코프로세서 형태의 별도의 제품으로 애드온되어 사용하던 것이 80486부터 기본CPU로 통합된 것으로 현재는 일반 프로그램에서 많이 쓰이진 않는다. 그러나 모든 x86아키텍쳐 CPU에 탑재되고 있는 매우 기본적인 명령어셋이기에 벤치마크 용도로서는 매우 유용하다[10]. 아주 일부 분야에서는, 미묘하게도 전작보다 성능이 아주 약간 내려간 모습을 보여주기도 한다.

공진 클럭 메시로 인해서 클럭 당 전력 소모가 상당히 줄었다. 클럭이 높아진 탓에 결과적으로 소모전력은 최대부하 상태 기준 가장 많이 줄어드는 경우 40 와트 정도 정도 줄었지만[11], 줄어든 소모전력조차 최대 부하 상태에서는 인텔보다 더 많다.[12] 그러나 이러한 전력소모는 오버클럭을 하게 되면 불도저 보다는 상당히 적게 먹지만 인텔에 비하면 여전히 많이 먹기에 최대 성능을 살리며 사용한다면 크게 의미 없는 향상이라 볼 수 있다.

당연한 일이지만, 인텔에 비해 뒤쳐지는 제조공정도 전력소모 면에서 비세라에게 불리한 점이다. 즉, 씨피유 전체 성능은 그럭저럭 따라잡은 것으로 보이나, 이 씨피유가 일반적으로 많이 쓰일 게임이나 단일 스레드 인코딩처럼 여러 코어의 연산 성능을 제대로 발휘하지 못 하는 경우는 아직도 이전 세대[13]의 물건들과 비슷한 모습을 보여주는 경우도 많다.

3.3.3. 이것 저것

인텔은 프레스캇으로 삽질을 했어도 플랜B였던 베니아스, 즉 펜티엄M이 높은 전성비를 보여줬고 이후 펜티엄M을 계승한 코어 아키텍쳐로 노선을 전환한 후 다시 승기를 잡을 수 있었지만, 현재 AMD로서는 인텔의 우월한 마이크로아키텍처를 당장 따라잡을 방법이 없다. 설령 앞으로 아키텍쳐에서 따라붙는다 해도 여전히 한 단계 이상 떨어지는 공정을 가지고 인텔의 성능을 따라잡을 수 있을지는 의문이다. 과거 K7 시절 처럼 불도저 역시 자금력이 떨어지는 AMD 로는 이 아키텍처로 최소 10년간 사용할 계획을 잡고 만들었을텐데, 망작이 나왔버렸으니...

FX-6300과 FX-8320이 아마도 인기모델이 될 가능성이 있는데, 그 이유는, FX-6300은 i3-3220을 가뿐히 이기고, FX-8320은 오버가 불가능한 i5 CPU와 겨루기 때문에 (FX-8320의 가격은 $180; i5-3570k는 $220) 오버를 통해 이길 수 있기 때문이다. FX-8350의 경쟁자가 (가격적으로) i5-3570K라서 (묵념)... 이제와서 그나마 경쟁이 된다는게 다행일려나 (...) 그런데 오버하면 파워, 좋은 FET장착된 보드, 사제쿨러가 필요하잖아... 안될거야 아마 게다가 소음 문제도 무시할 수 없지 K붙은건 배수락 풀려서 오버 가능하다
근데 핫스웰도 똑같이 해야하는게 함정,잉텔도 똑같다 i5 4670K 기쿨로 링스톨리면 100도찍고 쓰로들링 일어난다

15년 1월 30일 기준 FX-6300 11만, FX-8300 12만으로 6300은 고인...

다만 8스레드를 동시에 구동할 수 있는 제품 중에서 FX-8300같은 경우는 불필요한 포장을 제거한 멀티팩 패키지 형태로 인텔 대비 반값에 불과한 파격적인 가격으로 인해 멀티스레드 성능이 필요한 개발자사용자가 많이 찾고 있다[14].

플레이웨어즈에서 FX-8350을 8.1 GHz 극오버에 성공을 했다. 여기서 중요한 점은 모든 모듈이 동작하는 상태에서 이룬 오버라는 점이다. 공랭이나 웬만한 수냉으로도 5 GHz는 아마도 간단할 지도. 한전님이 좋아합니다
그런데 그것이 실제로 일어났습니다
로스엔젤레스에서 열린 E3에서 AMD는 두개의 새로운 모델을 공개했는데 그중 FX-9590의 최대 터보코어 클럭이 5 Ghz다... AMD에서는 터보코어 클럭 외에 어떠한 정보도 일절 공개하지 않았지만 여러 하드웨어 사이트에서는 이미 이외의 정보를 공개하고 있는듯. 해외 하드웨어 커뮤니티 사이트인 아난드텍에서 AMD에게 추가 정보를 요구했으나 거부했다고 한다.
그리고 밝혀진 바 TDP가 충격과 공포의 220W. 예약 판매 가격도 900달러(예약 판매가 실제 판매가보다 10%정도 비싸다고 해도 800달러 이상이다)가 넘기 때문에 일반 소비자 용은 도저히 아니다. 가격으로 보나, 스팩으로 보나, 다분히 상징적인 의미가 강한 제품. OEM용으로만 납품되다가 가격을 대폭 인하해서 2013년 10월부터 일반 사용자에게도 판매하기 시작했는데, FX-9370이 300달러, FX-9590이 450달러 정도. 일체형 수냉 쿨러가 포함된 구성의 가격이며, 쿨러가 들어있지 않은 구성의 가격은 50달러정도 저렴하다. 두꺼운 120mm 1열 라디를 사용한 일체형 수냉쿨러의 가격이 10만원 정도이므로 어느정도 합리적인 가격대에 판매중인 것이다. 하지만 그 놀라운 TDP는... 오버클럭 하기 귀찮다면 써볼 만 하다.

카베리 APU의 마케팅을 살펴보면 CPU쪽 4코어와 GPU쪽 8코어를 합쳐 황당하게 그냥 12코어 APU라고 광고를 하고있다. 마치 GPU가 CPU를 보조 하면서 성능을 끌어 올려주것 처럼 말하고 있다. 하지만 이는 소비자에게 혼동을 줄수 있는 부분으로 완전히 틀린말은 아니지만 이전에도 있었던 GPU의 가속이나 GPGPU를 이용하는 것일뿐 AMD만의 기술이라던가 새로운 시스템은 아니다. (과거 AMD에서 FUSION 으로 마케팅한바 있다 [15]) [16]

3.3.4. 제품 정보

제조 공정 : 32nm SOI
소켓 : AM3+(바이오스 업데이트가 가능하다면 AM3 계열 메인보드도 가능)
칩셋 : 9xx계열(바이오스 업데이트가 가능하다면 더 하위의 칩셋도 가능)
전 기종 배수락 해제, 오버클럭 가능

제품명 모듈/코어 기본클럭/터보클럭 L2캐시 L3캐시 열설계전력
FX9590 4/8 4.7GHz/5.0GHz 2 * 4MB 8MB 220W
FX9370 4/8 4.4GHz/4.7GHz 2 * 4MB 8MB 220W
FX8370 4/8 4.0GHz/4.3GHz 2 * 4MB 8MB 125W
FX8370E 4/8 3.3GHz/4.3GHz 2 * 4MB 8MB 95W
FX8350 4/8 4.0GHz/4.2GHz 2 * 4MB 8MB 125W
FX8320 4/8 3.5GHz/4.0GHz 2 * 4MB 8MB 125W
FX8320E 4/8 3.2GHz/4.0GHz 2 * 4MB 8MB 95W
FX8300 4/8 3.3GHz/4.2GHz 2 * 4MB 8MB 95W
FX6350 3/6 3.9GHz/4.2GHz 2 * 3MB 8MB 125W
FX6300 3/6 3.5GHz/4.1GHz 2 * 3MB 8MB 95W
FX4350 2/4 4.2GHz/4.3GHz 2 * 2MB 8MB 125W
FX4300 2/4 3.8GHz/4.0GHz 2 * 2MB 4MB 95W

3.4. 스팀롤러 아키텍처

파일드라이버 아키텍처의 데스크탑 씨피유가 출시조차 되지 않았던 2012년 9월, AMD는 스팀롤러 아키텍처에 대한 정보를 발표했다. 정수 연산장치 하나당 한 개의 독립된 디코더, 이제는 잘 쓰이지 않는 MMX 명령 연산 장치의 모듈당 개수를 2개에서 1개로 줄인 것, L1 캐시의 크기를 늘린 것, 가변 크기 L2 캐시, 더 효율적인 회로 설계를 통한 다이크기와 전력 소모의 30퍼센트 감소 등의 많은 개선 사항을 말하면서, 성능이 기존 파일드라이버보다 35퍼센트, 많게는 40퍼센트까지 오르리라고 말하지만, AMD가 불도저를 출시할 때 보여 준 엄청난 페이크를 생각할 때 성능 향상 수치에 대한 발언은 이것도 못 믿겠다는 사람들이 대다수이다. 또한, AMD 의 직원 대량 해고, 영업 적자가 발표된 2012년 10월에는, AMD가 스팀롤러 아키텍처의 씨피유의 발매를 2014년으로 늦추기로 했다는 이야기까지 나오고 있다...만, 일단은 AMD가 2013년 하반기 라인업에 카베리(Kaveri)를 추가시키면서 이 설은 잠잠해진 상태.

스팀롤러 기반의 카베리가 이미 동작 검증까지 컴퓨텍스 2013에서 완료한 상태이므로 상당한 진척이 있다는 것을 알 수 있다. 하지만 AMD의 설계팀은 모두 카베리를 개발하는데 투입되고 있으며 FX시리즈를 위한 인력은 거의 전무한 상태다. 동시에 두종류의 CPU를 설계하는 것이 불가능한 것이다. 하지만 다행히도 카베리의 CPU 모듈 자체의 설계는 이미 끝나있는 상태다. 메모리 컨트롤러와 하이퍼 트랜스포트등 시스템 상호 연결을 재배치 하면 되기 때문에 다시 만드는 정도의 시간은 필요치 않겠지만, 카베리가 투입되는 2014년 초중반 부터 최소 반년정도는 필요하므로 실제 샘플이 나오는것은 2014년 말, 소비자용은 2015년 은 되어야 만나볼 수 있을 것이다.

그리고 불투명한 것이 칩셋 지원이다. PCIe 컨트롤러가 노스브릿지에 탑재되어 있기 때문에 PCIe3.0을 사용하려면 새로운 칩셋의 발표가 불가피하다. 거기에 2015년에는 DDR4 메모리가 드디어 판매될 것으로 예정되어 있기 때문에 현재 AM3+ 소켓으로는 DDR4 메모리를 정상적으로 지원할 수 있다고 판단하기 어렵다. 물론 AMD는 데네브에서 DDR2/3메모리를 동시에 지원하는 메모리 컨트롤러를 만들어본 노하우가 있으므로 DDR3/4를 동시에 지원하는 것도 불가능해 보이지는 않는다. 이 근처는 아직 안개에 덮여있으므로 좀더 시간이 지나야 정확해질 것 같다.

AMD 카베리에서 밝혀진것에 따르면 파일드라이버 대비 20% 향상.
현재 시판되는 카베리에 와서는 단일스레드의 동클럭에서도 투반에 비해 약간 우위를 점하고 있다.
투반 iPC 값이 아마 요크필드랑 비슷했었지 아마?

2014년 12월에 나온 벤치결과 드디어 1세대 i 시리즈인 린필드의 IPC 를 따라잡았다고 한다...
린필드가 2009년에 나온 아키텍쳐라는건 묻지말자 잠베지에 비교하면 정말 엄청난 발전이다...
어쨌든 아직 샌디브릿지 까지는 멀고도 험하다


3.5. 엑스카베이터 아키텍처

AMD가 현재까지 발표한, 불도저 아키텍처의 거시적 성능 향상 계획의 마지막에 있는 아키텍처이다. 알려진 정보는 아무것도 없다. 이것의 견본이 나오는 게 빠를까 AMD가 망하는 게 빠를까 하지만 인텔이 망하게 놔두진 않겠지


3.5.1. FX라인과 일부 옵테론 라인의 모듈 구조의 개선 포기

2012년 말 스팀롤러 기반 아키텍쳐의 정보 발표가 있었지만 로드맵에선 FX라인의 신제품이 없더니 급기야 2013년 4분기 로드맵에선 2015년 까지 파일드라이버 아키텍쳐인 비쉐라로 유지하는걸로 되었다. 이후 2014년 5월 7일 기존 CMT 구조를 포기하고 정통적인 SMT방식의 새로운 아키텍쳐를 개발중인 것으로 AMD 공식 문서에 나와있다고 기사가 나왔는데, 이는 2012년 8월 AMD에 복귀한 Jim Keller의 영향을 받은것으로 보인다.

새로운 SMT구조의 아키텍쳐인 'Zen'은 2015년 발표 후 2016~2017년에 나올 예정이다.

옵테론 4300(6모듈)과 6300(8모듈)도 2015년 까지 파일드라이버를 유지 8모듈 16코어 싱글칩화(현재는 4모듈 X 2) 가 예정 됬었으나 워낙 안팔리는 대다 아키텍쳐 개선 포기를 했고.. AMD가 ARM기반 옵테론에 집중 마케팅을 하고있는 상황이라 시장에 나올지는 미지수..

APU쪽과 옵테론 2모듈(4코어) 기반은 2015년 엑스카베이터 아키텍쳐까지 계획되어 있으며 이는 마지막 CMT구조 아키텍쳐가 될것으로 예상 하고있다.


4. 같이 보기

----
  • [1] 다음 명령이 무엇인지를 CPU가 예측하여 처리시간을 단축, 그리하여 성능을 향상시키고 낭비되는 시간을 줄여 전력 감소 효과도 볼 수 있음
  • [2] 이것을 파이프라인 버블이라고 한다
  • [3] 분기 예측 캐시, 생소할지 모르겠지만 굉장히 중요한건데, 파이프라인 버블로 인해 생기는 문제를 최소화 할수 있다. 일례로 초창기 펜티엄4 윌라멧이 펜티엄3 보다 느렸던 이유가, 파이프라인은 2배로 늘렸는데, 분기예측캐시는 그대로였기 때문... 노스우드에서 이걸 무려 8배나 증강시키며 문제를 해결하게 된다, 윌라멧과 노스우드A의 차이는 0.18미크론에서 0.13미크론으로 변한것과 이것밖에 없다. 그럼에도 불구하고 두 CPU 의 평가를 보면 하늘과 땅차이
  • [4] 여기서 AMD의 비애가 드러나는데... 자금력 및 인지도가 부족하다는것이다... 현재 인텔의 경우는 수없이 아키텍쳐를 뜯어고치며 현재까지 왔지만, AMD의 경우는 하나하나의 아키텍쳐에 사활을 걸어야하는 수준, 96년 K6 부터 2010년 K8 까지 AMD의 아키텍쳐는 전부 퀀티 스피드 아키텍쳐라는 구조를 조금씩 개량해서 사용했었기 때문. 물론 이 아키텍쳐가 AMD 리즈시절의 엔지니어들로 부터 나온 진짜 정말 너무 잘 만든 아키텍쳐라 무려 15년이 가까운 세월동안 개량을 거듭하는것으로도 쓸수 있었고. -6년 콘로가 나오기 전까지만 해도 구조상 인텔에 비해 우위를 잡고 있었다, 그러나 불도저 시절은 당시 엔지니어들이 은퇴하거나 나가버린후 개발되었고, 설상가상으로 평타 수준도 아니고 재앙급의 설계덕에 그냥 망했다...
  • [5] 트랜지스터의 총량은 적을지 몰라도 FX 시리즈는 그래픽모듈 자체가 안들어간다
  • [6] 한국 공식 명칭이 "비셰라"였으나 수입사에서 2012년 12월 3일 기준 변경했다.
  • [7] 다만, 안 되는 경우도 있으니 메인보드 기종 체크할 때 참고하자. 특히 기가바이트의 보드인 경우 1.0/1.1 리비젼의 보드를 사용한다면 비세라를 못 쓸 확률이 높다.
  • [8] 물론 인텔보다 딸리는 코어당 성능을 펜티엄 4마냥 올리기 위해 클럭을 높게 잡은 거다.애초에 좋았으면 올릴 리가 없지.
  • [9] 동클럭에서 비교할경우는 부족하다 (IPC 값이 비쉐라가 투반대비 70~80% 정도 밖에 되지 않기 때문) 다만 비쉐라가 클럭이 과도하게 높다보니(...) 투반의 경우는 클럭으로 밀어버리는게 가능하다. 물론 투반의 IPC 값 조차도 무려 7년전의 요크필드 수준이라는게 함정
  • [10] 사실 벤치마크 용도로서도 x87명령어셋은 이미 시효가 한참 지났다. CPU제조업체들이 x87명령어셋은 호환 용도로만 남겨두고 보다 새로운 SIMD명령어를 빠르게 처리할 수 있도록 설계하는데 주력하고 있기 때문.
  • [11] 물론 전력 대비 성능은 당연히 높아졌지만
  • [12] 다만 부하가 거의 없는 상태에서는 대단한 차이는 없거나 오히려 약간 더 적게 소모하는 모습을 보여주기도 한다.
  • [13] 인텔과 비교한 그래프들을 보면 저가형과 비교한 게 아닌 이상 아직도 중-고급형 라인에 의해 몇몇 경우를 제외하고는 처참하게 깨지는 모습을 볼 수 있다. 게다가 Ivy Bridge는 이미 2012년 말 현재 Haswell로 교체 준비를 하며 단종되는 모델까지 나오는 상태다.
  • [14] 특히 대규모 소스 프로젝트 빌드 작업에는 멀티스레드 성능이 매우 중요해진다.
  • [15] 퓨전 마케팅은 상표권 침해 논란때문에 없어졌다.
  • [16] 사실 카베리는 HSA라고 CPU와 GPU간의 빠른 자료공유를 돕는 신기술이 적용되어 있다. 이를 이용한 GPGPU 가속을 하면 압도적인 성능을 얻을 수 있지만, 문제는 개발자들이 AMD 전용 명령어를 써서 추가로 프로그래밍 해줘야 된다는 점. 인텔이 나중에라도 자사규격 HSA를 만들면 3DNow! vs SSE나 SSE5 vs AVX때처럼 인텔규격에 흡수될지도 모른다.
Valid XHTML 1.0! Valid CSS! powered by MoniWiki
last modified 2015-03-26 03:25:16
Processing time 0.1252 sec