AMD

라이젠, 어떤 걸 봐야 할까?

2017. 3. 23. 00:46

ㅎㅎㅎㅎ 글쓰기를 좋아해서 블로그를 시작했는데, 막상 글 하나에 6시간 이상 투자하다 보니 꾸준한 업로드가 어렵네요
블로그 컨셉은 새로운 IT 소식에 대해 여러 매체들의 정보를 한 곳에서 볼 수 있게 하려는 것이었​는데요...
새 IT 소식이 올라오는 빈도는 빠르고, 글쓰기가 느린 저로서는 감당이 되지 않네요.
이 글도 내용 준비 외에 초안 작성만 5시간 정도 썼네요.
임시 저장 해놓고 글 마무리나 다듬기, 추가 내용 보충도 해서 작성한 글입니다...ㅎㅎ

라이젠, 반응

요즘 라이젠이 출시되면서 CPU쪽이 떠들썩 합니다. 긍정적인 반응도 있고 부정적인 반응도 있습니다.
라이젠 후기들을 보면 "이거 사도 되는건가..."하는 생각이 들게 하는 내용도 있습니다.
그 오해와 진실을 후기로 파헤쳐보려고 합니다.

라이젠의 장점은 8코어에 있습니다.
8코어는 멀티 쓰레딩을 지원하는 단일 프로그램에서 성능 향상이 생깁니다.
그리고 8코어는 멀티 태스킹이 훨씬 부드럽습니다.

또한 라이젠은 인공지능 기술인 SenseMI를 통해 더 조용하고 빠른 연산이 가능해졌습니다.

마지막으로 아직은 소프트웨어적인 최적화가 덜 되어있는 라이젠 무작정 따라하는 최적화를 준비했습니다.

멀티쓰레딩

많은 분들이 8코어로 멀티태스킹을 생각할 때 라이젠 8 단일작업 멀티쓰레딩 성능에 대해 얘기해보려고 합니다.

AMD에서 2011년 CMT구조의 CPU가 출시될 때, 제가 우려했던 부분은 멀티쓰레딩 게임이 없다는 것이었습니다.
SMT는 이론적으로는 싱글 쓰레드 프로그램에서도 성능하락이 없었고, 멀티 쓰레드를 지원하면 성능이 향상되는 구조였습니다.

SMT는 하나의 코어에 디코더를 두개 두는 방식입니다.

CPU는 원래 하나의 쓰레드만 처리할 수 있습니다. 하나의 코어로 여러 개의 쓰레드를 처리하려면 여러 개의 쓰레드를 굉장히 짧은 순간동안 바꿔가며 연산해야 합니다. 이게 우리가 컴퓨터를 하면서 보는 멀티 태스킹입니다.

그런데, 이 과정에서 코어가 연산하지 않는 순간이 생깁니다. 이 때, 디코더를 하나 더 두면, 코어가 연산하지 않는 순간을 줄일 수 있습니다. 이론 상으로는 성능은 감소하지 않습니다.

반면, CMT는 멀티 쓰레드 프로그램에서는 성능향상이 컸지만, 싱글 쓰레드 프로그램에서는 성능하락이 있는 구조였습니다.
때문에 8코어라고 홍보를 했지만, 실제로는 인텔의 듀얼코어에도 못미치는 벤치마킹 결과가 나타났습니다.

이후로도 몇년이 지나도록 반응이 없다가, 2016년 오버워치가 출시되면서 갑자기 비셰라가 업청난 상승세를 타게 됩니다.
8쓰레드를 지원하니 10만원대 CPU가 i5를 앞서는 오버워치 후기가 나왔기 때문입니다.

비셰라는 2013년에 출시된 CPU입니다. 그런데 3년 뒤, 놀랍게도 오버워치 출시 이후 이 CPU가 다나와 추천 피시에 사용됩니다.

이러한 역사는 라이젠에서도 우려되는 부분입니다.
지금까지는 인텔이나 AMD나 8쓰레드 CPU가 주력이었고, 지금의 프로그램은 그에 맞춰서 프로그래밍 되어 있습니다.
그래서 라이젠이 비셰라와 같은 길을 걸을 수 있는 우려가 생기는 겁니다.

그렇다면 우선 짚고 넘어가야 할 부분은, 흔히 벤치마킹 프로그램에서 테스트 하는 16쓰레드나 싱글 쓰레드의 퍼포먼스가 아니라 그 사이의 프로그램의 퍼포먼스 입니다.
멀티 쓰레드 프로그램이지만, 16쓰레드는 아니어서 라이젠의 일부 코어만 활용하는 프로그램의 퍼포먼스를 봐야 합니다.

이게 실제로 사용자가 느끼는 퍼포먼스가 될 것입니다.

인텔의 주력제품인 i7은 4C 8T CPU입니다. 라이젠에 비해 클럭이 높기 때문에 싱글코어 퍼포먼스는 더 좋은 편입니다.
라이젠은 현재 비슷한 가격으로 8C 16T CPU를 제시합니다. 클럭이 낮아서 싱글코어 퍼포먼스는 떨어집니다.

그러면 8쓰레드 게임에서는 라이젠은 i7을 이길 수 없는걸까??
정답은 아니요 입니다.

8개 쓰레드의 프로그램을 8개의 물리코어로 처리하면 같은 8 쓰레드를 사용하더라도 성능이 더 높게 나타납니다.

American Truck Simulator 게임이 CPU의존도가 높아서 이 게임으로 보여주려고 합니다.

Windows 의 Power Plan이 균형 조정일 때

3개의 물리코어가 활성 상태입니다. 6개의 쓰레드를 사용하고 있구요.
전체 CPU이용률은 16%입니다.
130FPS가 나옵니다. 차량이 없어서 프레임 편차는 1~2입니다.

Windows 의 Power Plan이 고성능일 때

코어파킹이 꺼집니다. 코어 0,3,5,7,9,15. 즉, 6개의 쓰레드를 사용하고 있습니다.
차이점이라면 서로 다른 물리코어를 가리켜서 6개의 코어가 활성 상태입니다.
그리고 활성 상태인 물리코어의 가상코어는 코어 1을 제외하고는 연산하고 있지 않습니다.
전체 이용률은 15%입니다.

쓰레드 분배가 고르지 않고 코어 0과 15를 특히 많이 사용하고 있습니다.
155FPS가 나옵니다. 마찬가지로 차량이 없어서 프레임 편차는 1~2입니다.

놀랍게도 6개의 물리코어를 사용할 때 약 20%의 성능 향상이 생깁니다.
고성능 파워 플랜에서 더 높은 성능을 보여줍니다.

연산에 사용되는 쓰레드와 이용률은 같은데 활성 물리 코어만큼 성능이 향상되는 것을 볼 수 있습니다.
같은 양의 연산을 하더라도 물리코어를 사용한다면 6개의 쓰레드를 동시에 처리하게 됩니다.

반면, 같은 양의 연산에 있어 가상코어를 사용한다면 6개의 쓰레드를 "동시에" 처리하는 건 아닙니다. (상단의 SMT설명 참고)
그 외에도 SMT는 캐시와, 버스를 공유하기 때문에 병목의 가능성이 있습니다.
그래서 멀티쓰레드 프로그램이라면 가능한 한 물리코어가 많이 활성화 되는 것이 성능 향상에 도움이 됩니다.
즉, 물리 코어에 쓰레드를 분배하는 것이 성능 향상에 도움이 되는 것입니다.

i7의 경우에도 코어파킹이 작동한다면 4쓰레드 프로그램을 이용할 때 i5보다 성능이 떨어지는 결과가 나타나기도 합니다.

참고 글 1

4세대 i7의 글에도 게이밍에는 HT를 끄는 것을 추천하는 댓글이 많습니다.

그리고 코어파킹과의 이슈에 대한 언급도 이 글에 있습니다.

참고 글 2

여기서는 6700에서도 HT를 켜면 게임 성능이 감소한다고 합니다.

그래서 i7을 위해 8쓰레드 게임을 만들었는데, 이게 왠걸... 비셰라가 갑자기 떠버린 겁니다...

라이젠과 같은 8C 16T CPU에서는 16쓰레드 프로그램이면 좋겠지만, 대부분 게임은 아직 16쓰레드까지는 지원하지 않습니다.
그렇다고 SMT를 끄자니 16쓰레드 프로그램에서는 SMT의 성능이 증가하는 게 뚜렷하게 보입니다.
그래서 게임의 쓰레드를 물리코어에 우선 할당할 필요가 있습니다.

글 하단에서 무작정 따라하는 최적화를 확인하세요.

AMD가 CMT를 버리고 SMT로 전향하면서 멀티 쓰레드를 조금 내려놓고 싱글 쓰레드 퍼포먼스도 챙기는 모습을 보입니다.
하지만 SMT구조에서도 AMD는 멀티 쓰레딩에 강점을 가지고 있습니다.

AMD는 멀티 쓰레드가 미래의 중요한 컴퓨터 기술이 될 것을 강조하는 듯합니다.

출처 : 다나와

1700x는 3.4Ghz up to 3.8Ghz이고
6900k은 3.2Ghz이고 up to 3.7Ghz입니다.
그런데 이 벤치 결과는 상당히 인상적입니다.

라이젠이 싱글 쓰레드에서는 4% 밀리는데, 멀티 쓰레드는 40%에 가까운 차이로 압도하고 있습니다.

출처 : guru3d.com

이러한 양상은 CPU-Z에서도 확인 가능합니다. CPU-Z는 Multi Thread Ratio라는 값이 있습니다.
Multi Thread Ratio는 (멀티쓰레드 점수) / (싱글 쓰레드 점수)의 결과입니다.

즉, 멀티쓰레드 점수가 싱글 쓰레드 점수에 비해 높을수록 Multi Thread Ratio는 증가합니다.
그리고 Multi Thread Ratio가 증가하면 멀티코어 효율이 증가하는 것입니다.

같은 8C 16T인 Intel Core i7 6800K는 Ratio가 7.27입니다.
AMD Ryzen 7 1800x는 Ratio가 8.88입니다.

인텔은 물리코어가 8개임에도 불구하고 8배 조차도 달성하지 못합니다.
하지만 AMD는 8배를 넘는 결과가 나타납니다.

비셰라와 마찬가지로, 쓰레드가 많은 게임이 출시되면 라이젠은 빛을 발할겁니다.

비셰라와 다르게 라이젠은 16개 이상의 쓰레드를 이용하는 게임이 나오면 경쟁 제품을 압도할 것입니다.

멀티태스킹

멀티 코어라고 하면 많은 사람들이 결국은 멀티 태스킹을 떠올리게 됩니다.

라이젠 덕에 8코어 CPU가 비교적 만만한 가격대로 내려오면서 프로그래머나 영상, 디자인쪽이 아닌 게이머들의 관심을 받기 시작했습니다.

그런데 대부분 8코어가 클럭이 낮아서 게임에서 약하다는 결과가 나오면서 오히려 부정적인 인식이 생겼습니다.

"어차피 게임하면서 다른거 하는 사람 없다"라는 반응이 꽤 많이 보입니다.

저도 4C 8T제품을 사용할 때는 같은 생각을 가지고 있었습니다. 왜 게임을 하면서 다른 걸 보려고 하는걸까??

저는 144Hz 모니터를 씁니다. 게다가 민감해서 130FPS도 화면이 밀리거나 끊기는 게 느껴지고, 랭크전에서는 짜증날 정도로 민감한 부분이라 멀티태스킹은 거의 안했습니다.

그런데 8코어가 생기니 게임하면서도, 144FPS를 유지하면서도 다른 작업이 가능해지니 다른 것을 보게 됩니다.

라이젠 사고 나서 가끔은 게임을 두개 켜기도 하고, 친구 방송이나 유튜브를 재생하면서 게임을 하기도 합니다.

프레임 드랍이 없기 때문입니다.

게임 하면서 다른 걸 보지 않았던 게 아니라 게임을 하면서 다른 걸 보지 못했던 겁니다.

그래서 라이젠이 멀티 태스킹에 얼마나 강한지 보여주려고 합니다.

저는 영상처럼 높은 사양을 요구하는 멀티 태스킹은 하지 않습니다.

다만 이러한 성능 상의 여유 덕분에 멀티 태스킹에 더 이상 부담을 느끼지 않게 되었다는 것을 보여주고 싶습니다.

-------------------------------- 녹화 영상 --------------------------------

-----------------------------------------------------------------------------

이 영상은 디스플레이 녹화와 영상 재생을 CPU로 처리했을 때와 GPU로 처리했을 때의 차이를 보여줍니다.

먼저 CPU로 처리하면서 오버워치 프레임을 확인하고, 'GPU로 처리하는 것'을 녹화한 영상을 재생하면서 설명을 진행합니다.

영상 처리를 GPU로 할 경우 최대 143FPS가 나옵니다.

이 때 CPU사용률은 53%입니다. 한타 때는 80FPS까지 떨어질 수 있습니다.

영상 처리를 CPU로 할 경우 최대 254FPS가 나옵니다.

이 때 CPU사용률은 84%입니다. 한타 때에도 최소 120FPS보장됩니다.

같은 상황에서 CPU를 먼저 사용하고 이후 GPU로 처리하면서 오버워치의 FPS를 비교합니다.

CPU로 처리했을 때는 평균 80FPS정도 높게 나옵니다.

GPU로 처리하면 프레임이 낮게 나오는데, 그 뿐 아니라 녹화된 영상 자체가 끊기는 모습을 보여줍니다.

이전 i7-4790k를 사용할 때는 듀얼 모니터 이면서도 게임하다가 할 일이 생각나면 메모장에 할 일을 적었습니다.

그런데 라이젠은 게임하다가 할 일이 생각나면 그냥 할 일을 하면 됩니다. 프레임 감소나 프레임 드랍을 걱정할 필요 없습니다.

(지금은 시작표시줄이 가득해서 뭐가 있는지 모르는 건 비밀)

SenseMI

SenseMI는 라이젠에 탑재된 기술입니다.

Pure Power : CPU온도와 리소스 사용량을 모니터링하여 전력소비를 최소화하는 기술입니다.

전압을 자체적으로 조절할 수 있습니다.

Precision Boost : 25Mhz단위로 클럭을 조절합니다.

XFR : 자동오버클럭입니다. 쿨링 상태에 따라 자체적으로 작동 클럭을 향상시킵니다.

Neural Net Prediction : 신경망 예측 기술입니다. 앱의 행동에 빠른 프로세서 경로를 준비하여 성능을 향상시킵니다.

Smart Prefetch : 앱에서 필요한 데이터를 미리 가져옵니다. 인공지능 기술로 학습기능을 가지고 성능을 향상시킬 수 있습니다.

출처 : AMD.com

성능이 개선되었다는 후기(하드웨어 배틀)가 있습니다.

블소에서 성능차이 없이 CPU 이용률이 감소하고 3차 실행에서는 성능도 증가합니다.

아쉽게도 저는 하나의 게임만 하는 게 아니어서 큰 CPU 이용률 감소를 느끼지 못했습니다.

그래서 추가적인 테스트는 없습니다.

그런데 AMD 공식 페이지의 설명에 따르면 조금 재미있는 부분이 있습니다.

Neural Net Prediction : 프로그램이 CPU를 사용하는 맵을 "임시"로 생성

Smart Prefetch : 응용 프로그램이 자체 데이터에 액세스하는 방법을 학습

위 설명에 따르면 Smart Prefetch에는 "임시"라는 단어가 없습니다.

처음 하드웨어 배틀 후기가 떴을 때 PC방의 라이젠은 가격이 비쌀 것이라는 짤도 있었는데 사실이 될지도 모릅니다.

Windows 업데이트(2017.03.16)

쓰레드 분배 개선 업데이트가 되었습니다. 그 외에도 버그 개선 업데이트가 있었습니다.

몇몇 명령어를 사용할 때 충돌 현상 해결됬다고 합니다. 오버클럭 안정화 테스트에서 문제가 있던 분 다시 시도해보세요!

쓰레드 분배의 효과는 아래 사진으로 볼 수 있습니다.

앞서 American Truck Simulator를 통해 설명했던 부분입니다.

업데이트 이전에는 8쓰레드 프로그램에서 아이러니하게도 10개의 쓰레드를 사용합니다.

업데이트 이후 물리코어에 쓰레드를 할당해줍니다.

첫번째 사진에서는 들쭉날쭉 하지만, 두 번째 사진에서는 코어를 최대한 사용합니다.

이용률을 정확히 알 수 없지만 서로 비슷해 보입니다.

American Truck Simulator에서 본 것 같이, 이용률은 비슷한데, 물리코어에 우선 할당함으로써 20%의 성능 향상이 생겼습니다.

물리코어에 우선 할당하니 코어 파킹을 활성화하면 성능이 크게 떨어지던 부분이 해소됬습니다.

정리하며... 마지막 푸념 글

게임에서 다소 약한 모습을 보이더라도 충분히 강력한 성능을 가지고 있으며, 멀티 태스킹이나 영상처리에 있어서는 경쟁 제품보다 우수한 성능을 보여주고 있습니다.

이런 성능에도 경쟁 제품 대비 100만원가량 더 싼 가격이라는 것이 라이젠의 경쟁력입니다.

인텔도 신제품이 공개될 때마다 소프트웨어 최적화가 덜되어 이전 모델보다 성능이 떨어진다는 후기/벤치마킹이 나오기도 했습니다.

얼마 되지 않은 카비레이크도 이런 대우를 받기도 했습니다.

라이젠이 GTX 1080에서 대역폭 문제가 있다는 부분도 GTX 1080ti에서 오히려 격차가 감소하는 모습을 보이며 라이젠의 문제가 아닌 것을 증명해 주었습니다.

당분간은 성능 이슈가 계속 나타날 것이고, 그것이 점차 해소되는 방향으로 움직일 것입니다.

다만 보드의 문제는 이해하기 어려운 부분이 없지않아 있습니다.

분명히 AM4와 B350은 작년 9월 제품이 출시됐습니다. 소캣과 칩셋 공개는 그 전에 이루어졌을 것입니다.

하지만 6개월, 반년이 지나 아직도 바이오스 문제가 생기고 있습니다.

램 호환성, 코어 끄기 문제는 모든 램을 써볼 수 없고 모든 게임을 플레이 할 수 없으니 이런 부분은 이해 할 수 있습니다.

그런데 Racing GT나 F-Stream Utility는 왜 여태까지 안정화 하지 못한건지 모르겠습니다.

Racing GT는 보드 출시 전부터 프로그램이 있었지만 실행이 안됐습니다.

F-Stream은 3주가 지나서야 프로그램이 홈페이지에 게제되었습니다.

F-Stream은 나름 안정화는 된것 같은데 사실상 불안정한 기능은 전부 제거한 듯이 부실한 모습을 보여줍니다.

어떤 분은 보드가 완벽하게 출시되기 전에 라이젠을 판매한 AMD 잘못이 있다고 합니다.

하지만 그건 아닙니다.

이미 반년을 기다렸습니다.

지금 라이젠 보드 물량이 부족한 건 전 세계적인 현상이고, 이는 보드 회사들이 물량을 충분히 만들지 않은 것입니다.

회사는 손해가 적어야 이익이 커지기 때문에 라이젠이 언론상으로 유명세를 타더라도 실제로 팔릴지 안팔릴지는 확신하기 어렵습니다. 그래서 기존의 AMD보드 판매량 만큼 물량을 공급했을 것입니다. 보드를 소량만 생산했을 것입니다.

그러므로 보드가 안정되기 전에 라이젠이 먼저 출시되어 라이젠의 저력을 보여준 건 빠른 최적화를 위해 오히려 좋은 선택이었다고 봅니다.

이게 2등의 비애입니다. 그리고 이걸 지켜보는 즐거움이 있는 게 2등의 특징이기도 합니다.

이상으로 라이젠 후기를 마칩니다. 계속 인텔을 견제하며 선의의 경쟁 하기 바랍니다!

RX 시리즈 144Hz 이슈 해결법

2016. 8. 31. 17:54

이번에 새로운 제품이 출시되고 144Hz모니터를 사용하는 분들이 화면이 떨리는(Flicker) 현상을 겪고 있을겁니다.

출시된지 얼마 안된 RX에 144Hz를 같이 쓰는 유저들은 더더욱 없을텐데요... 때문에 아직까지 큰 이슈가 되지는 않았고, 드라이버 업데이트를 기다리는 실정입니다.

아마 지금은 120Hz로 주파수를 낮춰서 사용하고 계실겁니다. 하지만 144Hz이상의 Refresh Rate를 RX시리즈에서 사용할 수 있는 방법을 '제가' 찾았습니다!

144Hz에서 화면이 흔들리는 현상의 해결방법은 주사율을 144이상으로 올리는 겁니다.

atikmdag-patcher

첨부파일을 먼저 다운받고 압축을 풉니다.

사용자 지정 해상도.zip
다운로드

atikmdag-patcher폴더 안에서 atikmdag-patcher를 실행합니다.
당연히 예(Y)를 누르는 거구요. 저는 이미 패치가 되어있어서 복원하겠냐고 질문합니다.

크림슨 16.1까지 된다고 써있는데, 공식 페이지 가보니 같은 버전으로 7.3까지 지원합니다.
같은 버전으로 7개월간 적용됬으니 8도 될거라 추측을 합니다.
(저는 현재 최신버전(8.2인가요?)에 적용했고 문제 없습니다.)

이 프로그램은 드라이버의 주사율 제한을 해제합니다.

CRU patcher

다음은 CRU폴더의 CRU를 실행합니다.

그러면 사진처럼 나타나는데요, 맨 위의 드롭다운 메뉴에서 자신의 모니터를 선택하고, 바로 아래칸에 있는 Detailed Resolutions를 수정합니다.

모니터의 최댓값인 144Hz를 대체하려면 Detailed Resolutions항목에서
"1920x1080(자신의 해상도) @ 144(주사율) Hz" 부분을 클릭하고
Edit을 누릅니다.
모니터의 최댓값을 그대로 두고 Add를 클릭하셔도 됩니다.

그러면 위와 같은 창이 나타나는데요, 가장 아래쪽의 Frequency박스 안에 Refresh Rate를 수정합니다.

모니터의 사양에 따라 144 이상의 값을 넣어주세요.

"저는 160Hz, 180Hz에서 테스트했고, Flickering은 없습니다."

OK를 누르시고, Detailed Resolutions 에 적용됬는지 확인 후 OK를 눌러서 저장합니다.
그리고 CRU폴더 내의 restart.exe를 눌러서 드라이버를 다시 로드합니다.
화면이 두번 깜빡거립니다.

나는 64비트이니 restart64해야지~ 하지 마시고 restart실행하세요

이후 모니터 설정에서 주사율을 조절합니다.

윈도 10의 경우

설정-시스템-디스플레이 로 이동

바탕화면 우클릭하면 바로 이동 가능합니다.

하단의 고급 디스플레이 설정 클릭

하단의 어댑터 속성 표시 클릭

모니터 탭에서 화면 재생 빈도 조절

이렇게 하면 144Hz의 주사율을 Flickering 없이 이용하실 수 있습니다~!!
드라이버 업데이트 때마다 매번 반복하셔야 합니다.

RX 470 WattMan. 오버클럭/언더볼트 팁

2016. 8. 28. 00:05

시작하기 전에

스마트폰 LG Optimus EX이후로 클럭별로 전압조절하게 될줄 몰랐습니다.!
옵티머스때는 CPU 0.3, 0.4, 0.5, 0.7, 0.9, 1.0,1.2Ghz에 대하여 700mV에서 1.2V까지 주었습니다. 그때는 시스템로그를 파일에 쓰게 해서 폰이 멈추거나 다운되면 마지막에 어떤 STATE 였는지 찾아서 전압을 조절했는데요,
안타깝게도 WattMan은 어떤 STATE에서 그래픽이 오작동했는지 알 방법이 없습니다. 그래서 전압에 여유를 주고 오버클럭/언더볼트를 진행하게 됩니다.

Radeon HD 7970은 WattMan자리에 OverDrive가 나오는데, AMD OverDrive였을때는 클럭밖에 조절할 수 없어서 Afterburner를 이용했습니다.
그러다보니 슬라이더 조절하고 적용버튼을 못찾아서... 와트맨 적용 안되네??? 하다가 어제 적용버튼을 찾아서 와트맨을 써봤습니다.

Radeon HD 7970은 1050Mhz에 1250mV인데, RX 470은 1260Mhz에 1150mV네요....신세계...
Radeon HD 7970을 쓰던 시절 저는 1050Mhz에 1250mV이던 것을 언더볼트하여 1144mV로 사용하였습니다.
그런데 날이 더워지니 부스트클럭 1050Mhz을 못버티고 베이스클럭으로 떨어지더군요. 그때가 950Mhz, 1200mV였습니다.
역설적이게도 뜨거워서 클럭을 낮췄더니 더 열을 많이냈고, 결국은 게임중인데도 500Mhz로 다운됐습니다.

그런 제품을 쓰다보니 낮은 state에서도 전압을 내릴수 있는 방법이 나왔으면 좋겠다 생각했습니다.
커스텀 바이오스 제작하는 방법이 있었지만 UEFI를 지원하지 않게 된다고 해서 그냥 참았습니다.

그런데 때마침 저만을 위한 그래픽카드를 AMD에서 출시한 겁니다.!!

하룻동안 만져본 와트맨을 건드려봤습니다.
인터넷에 찾아보니 와트맨이 "이런 기능이 있더라" 는 있지만, 이대로라면 정말 꼼짝없이 모든 STATE 에 대하여 안정성 테스트를 해야할 느낌입니다.ㅠㅠ 그래서 간단히 할 수 있는 방법을 소개해드리려고 합니다.

와트맨 주의사항

게임을 하지 않을 때는 클럭이 낮게 동작해서인지 렉이 상당히 심합니다. 게임을 실행해놓고, 클럭이 높아졌을때 이용하세요
모니터링할때 렉이 상당히 심합니다. 게임하면서 몇초씩 멈추는데 전압을 낮게줬거나 클럭을 높게한거 아닙니다. 나중에 와트맨 유틸리티? 끄고 게임해보시면 멈춤 현상 없습니다

당연하지만 패치됐습니다. 페이지뷰가 많아서 고칠 게 있나 다시 읽어봤는데 뭔 말인지 모르겠더라구요. 너무 오래 전에 패치된 내용이라 까먹었지 뭔가요. (2018.12.20수정)

와트맨 중요사항

블로그나 여러 후기들을 보면 전력제한을 늘리면 성능이 증가한다, 메모리전압을 줄이면 성능이 증가한다고들 합니다.
전력제한은 50으로 할경우 발열만 증가한다고 하니 20정도로 두세요. 메모리는 발열이 큰편은 아니니 크게 욕심내지 마십시오.

제 와트맨 설정입니다.

RX 470이나 RX 480 사용중이신분들은... 제가 state 1부터 state 7까지 전부 기존과는 클럭이나 전압이 다르다고 생각하실겁니다.nn
맞습니다.(2018.12.20수정)

여기서는 간단하게 모든 STATE 에 대하여 오버클럭/언더볼트하는 방법을 공유하려고 합니다.
state 7(클럭이 가장 높은 단계)에서 오버클럭 하는 방법은 쉽습니다.(2018.12.20수정)
전압을 조절하고, 안정화 테스트를 돌려보는거죠. FurMark라는 툴을 이용하시거나, 게임을 직접 플레이해보시면 됩니다.(2018.12.20수정)
개인적으로는 오버워치 로비 화면이 안정화 테스트에 큰 도움이 되더군요.(2018.12.20수정)
메모리 오버클럭을 하실 경우에는 당연히 다른 안정화 테스트 방법을 사용해야 합니다.(2018.12.20수정)

필자 팁

WattMan을 보시면 알수 있듯이, STATE 가 7개나 있습니다. 우리는 이것을 모두 오버클럭/언더볼트하고 안정화 테스트를 할 수 없습니다. 그래서 몇 개의 STATE는 추측하여 전압을 조절하게 됩니다.

위 사진에 검은 줄로(2018.12.20수정) 표시해둔 것처럼 클럭이 올라갈수록 같은 클럭 증가량에도 더 많은 전압 증가가 필요합니다.
"만약 코어클럭이 직선형태로 증가하는 모습이었다면 전압은 역 포물선 형태에 더 가까울 것입니다."

이것은 모든 프로세서, 즉 CPU/GPU 그리고 모바일 기기에도 통용되는 것입니다.

그렇기 때문에 이 모습을 참고하여 오버클럭/언더볼트 한다면 모두 안정화 테스트를 하지 않아도 안정적인 결과를 얻을 수 있습니다.

안정성 테스트

안정화 테스트에 있어서 물론 클럭, 전압 수율이 맞는것도 중요합니다만, 절전기능(SpeedStep, Cool&Quiet)을 이용하게 되면 클럭이 바뀔때의 안정성도 상당히 중요합니다.

RX470 또한 절전기능이 내장되어 있고, 모든 클럭에 대해 언더볼트를 할 것이라면 클럭이 유동적으로 변하는 저사양 게임으로 한번 테스트 해봐야 합니다.(2018.12.20수정)

안정성은 안정화 테스트를 돌려보면 알 수 있습니다. FurMark라는 툴을 이용하거나, 게임을 직접 플레이해보시면 됩니다.(2018.12.20수정)

개인적으로는 오버워치 로비 화면이 안정화 테스트에 큰 도움이 되더군요.(2018.12.20수정)

메모리 오버클럭을 하실 경우에는 당연히 다른 안정화 테스트 방법을 사용해야 합니다.(2018.12.20수정)

오버클럭/언더볼트

본격적으로 오버클럭을 시작합니다.

"오버클러킹, 언더볼팅은 모두 각자에게 책임이 있으며, 필자는 책임지지 않습니다."
이 문구는 WattMan을 처음 실행할 때도 나오는 문구입니다.-AMD도 책임지지 않습니다.-

  1. 위 사진에 그려둔 그래프를 생각하면서 STATE 7을 오버클럭을 합니다. 저는 1360까지 성공했고, 안정성을 위해 1345로 내렸습니다.
    안정화 테스트 중 화면 또는 컴퓨터가 멈추거나 꺼지는 등 비정상적인 반응이 있으면 클럭을 조금씩 줄여나갑니다.(2018.12.20수정)

    WattMan설정을 스크린샷으로 복사합니다.

  2. 이젠 STATE 6의 전압을 낮출 겁니다.
    클럭의 단계가 올라갈수록 전압은 같거나 더 높아야 합니다. 그렇기 때문에 STATE 6에 사용할 클럭과 전압을 그대로 STATE 7에 넣어주고 적용합니다.(2018.12.20수정)

    비정상적인 반응이 있으면 클럭을 낮춥니다. STATE 6는 STATE 7의 상태로 열이 감당되지 않을 때에 클럭이 발열 조절을 위해 클럭이 낮아질때 사용될 구간입니다. 수율에 맞춰서 최대한 타이트하게(Tight) 안정화를 해줍니다.

    앞서 말씀드린 것처럼, 절전기능이 적용되면 클럭이 바뀔 때의 안정성도 중요하기 때문에 안정화 된 값에서 10Mhz정도 낮춰줍니다.(2018.12.20수정)

    1번 단계에서 찍은 스크린샷에 따라 STATE 7을 오버클럭한 상태로 만듭니다.

    WattMan설정을 스크린샷을 찍어 복사합니다.

  3. STATE 5에 대해 2번과 같은 동작을 반복합니다.

    1100Mhz까지는 간단한 웹서핑 중에도 자주 올라갑니다. 그러니 언더볼트를 한다면 좀더 적은 전력소모를 보여줄 겁니다.

    하지만 이 쯤 부터는 전압이 충분히 낮기 때문에 4번 단계로 건너뛰어도 무방합니다. .(2018.12.20수정)

  4. STATE 1은 클럭은 그대로 두고 800mV로 언더볼트합니다. 보통은 잘 작동할겁니다.(2018.12.20수정)

  5. STATE 2도 일반적으로 800mV로 작동할 것입니다.

    하지만 3번에서 말씀드린 것처럼 전압을 여유롭게 주어도 됩니다.(2018.12.20수정)

  6. STATE 3과 STATE 4는 다른 클럭을 참고해 추정합니다.

    전압이 충분히 낮아지면 전압이 바뀌어도 (언더볼트를 위해 노력한 만큼) 전력 효율이 크게 변하지 않습니다.

    안정화에 스트레스 받지 마시고 전압을 여유롭게 줍니다. 각 STATE의 전압 대비 클럭이 포물선 형태를 유지하게끔 하되 중간 부분은 전압을 여유롭게 줍니다

    사진을 보면 전압 증가폭은 점점 커지고, 클럭 증가폭은 점점 감소합니다. 이런 모양에 따라 보기 좋게 클럭과 전압을 조절합니다. (2018.12.20수정)

  7. 본인이 하는 게임에서 그래픽카드가 주로 머무는 STATE 를 기억해두고, 게임이 불안정하면 해당하는 클럭을 언더클럭/오버볼트합니다.

    이후 6번의 설명에 따라 양 옆 STATE도 보기 좋게 클럭과 전압을 조절합니다.

ps. state 0는 300Mhz/800mV입니다.

2018.12.20 개정

AMD와 Nvidia 차세대 그래픽 폴라리스 VS 파스칼

2016. 2. 18. 22:48

얼마 전, AMD의 기대를 받고 있는 ZEN아키텍처 기반 CPU에 대한 소식을 전해줬다. 이번엔 AMD의 그래픽이다.

그래픽도 그동안 CPU처럼 정체된 모습을 보였다. 무려 3세대 동안(7000 Series, 8000 Series, rx 200 Series rx 300 Series)이나 뚜렷한 발전이 없었고, 심지어는 차세대 그래픽과 BIOS가 호환되기도 한다.

이번 그래픽의 코드네임은 폴라리스다. 그 동안 AMD는 전성비(전력 대비 성능 비)가 낮아서 노트북에 고성능 그래픽을 넣을 수 없었다. 그런데 폴라리스는 경쟁사 그래픽 대비 60%의 전성비를 갖고 있다고 한다. 또한 아키텍처 개선이 미묘했던 전 세대와 달리 이번엔 대부분 개선이 이루어졌다.

물론 AMD만 개선되는 건 아니다. Nvidia도 개선됬다. 이번엔 차세대 그래픽 프로세서의 루머와 알려진 정보를 바탕으로 비교해본다.

전성비

우선 AMD의 폴라리스. 전력 효율이 하드웨어와 소프트웨어의 개선으로 GTX950 대비 동일 성능 60%정도의 전력소비를 갖는다.
이전 세대가 동일 성능 대비 경쟁제품에 비해 전력소비가 큰걸 감안하면 전성비가 대폭 향상되었음을 알 수 있다.

Nvidia도 전 세대에 비해 전력소비가 40%감소했다고 강조하고 있다. 위의 발표대로라면 전성비는 막상막하일 것이다.

제조 공정

현재 AMD의 폴라리스는 14nm FinFET공정으로 알려져있고, 엔비디아의 파스칼은 16nm FinFET공정으로 알려져 있다. 엔비디아는 이전처럼 TSMC를 통해 그래픽을 생산할 예정인데, AMD는 알려지지 않았지만 14nm FinFET을 제조할 수 있는 글로벌 파운드리나 삼성을 통해 제작할 예정이다.

14nm / 16nm는 기존의 28nm대비 40%이상 미세화되었고, FinFET은 같은 성능에서 더 낮은 전류를 사용하고 최대전류가 증가하여 더 큰 성능을 낼 수 있을 것으로 기대하고 있다.

그래픽 메모리

그래픽 메모리는 두 제품 모두 2세대 HBM을 이용할 것으로 보인다.HBM은 기존 메모리에 비해 대역폭이나 전력소비가 2배 이상 좋아진다.
하지만 이전 AMD에서 플래그십 모델에만 HBM 메모리를 사용한 것을 보아 이번에도 플래그십 모델에만 사용할 것으로 전망하고 있다.

대신 하이엔드/퍼포먼스급 그래픽에는 GDDR5X그래픽을 사용할 것으로 보인다. GDDR5X는 GDDR5에 비해 대역폭이 두배 향상된다.
폴라리스와 파스칼은 차세대 그래픽에서 비슷한 양상을 보이고 있는데, 물론 차이점도 있다.

GPU 디자인

위에서 말했듯이 폴라리스는 아키텍처의 대부분이 바뀐다. 이 변화의 이점은 공개되지 않아 제품이 출시되어야 알 수 있다.

엔비디아는 NVLink라는 기술을 도입한다. PCIe를 대신할 인터페이스로 PCIe는 CPU와 그래픽이 연결된다면, NVLink는 CPU와 GPU뿐 아니라 GPU와 GPU끼리도 직접 연결될 수 있다.

또한 PCIe는 16GB/s의 대역폭을 갖고있는 반면, NVLink는 80GB/s를 갖고 있어서 대역폭이 크게 개선될 것이다.

Unified Memory라는 기술을 지원한다. 이를 통해 애플리케이션 개발자들은 데이터가 GPU메모리와 시스템 메모리중 어디에 있는지 몰라도 된다.

필자는 유니파이드 메모리는 (분명히 이들의 목적을 다르지만) AMD의 HSA와 비슷한 기능을 하게 될 것으로 생각한다.

유니파이드 메모리 기술은 C/C++언어에서 메모리를 공유하는 기능을 한다.

반면 AMD는 OpenCL을 통해 소수연산을 CPU로 할지, GPU로 할지 자동으로 결정한다(AMD는 경쟁사 대비 그래픽이 강하기 때문에 (애플리케이션 개발자가 그래픽연산으로 넘겨주지 않아도)자동으로 그래픽 연산을 한다면 최대 80배 빠른 성능을 낼 수 있다.). 이때 그래픽과 CPU사이에 빠른 연계를 위해 메모리를 공유하게 된다. (HSA제품이 대표적으로 PS4, 시스템메모리=그래픽메모리=HBM)

HSA가 효율성이 좋지만, 현재 C/C++언어가 더 널리 사용되고 있고 엔비디아 소비자가 많은 만큼 개발자가 유니파이드 메모리를 활용할 가능성이 높다.

목표의 차이

AMD는 역시나 색감을 강조하고 있다. 필자는 AMD 그래픽을 사용하는데, 중고로 조립할때 매물 많은 엔비디아를 선택했다가 후회를 했다(색감은 개인차가 있다는 것을 말해둔다)

엔비디아는 기존처럼 성능을 중심으로 한 홍보에 나섰다. 이번엔 자율주행 차량에 탑재될 Drive PX 2를 앞세워 성능을 강조했다.

파운드리의 경쟁

앞서 말한 바와 같이 엔비디아는 TSMC AMD는 14nm공정기술을 갖고 있는 GF나 삼성이 될 것으로 예상하고 있다. 기존엔 AMD도 TSMC였지만, TSMC의 물량공급이 부족해서 AMD가 호기일때 제대로 판매하지 못한 적도 있다.

다만 엔비디아도 TSMC에서 애플과 화웨이에 우선공급한다면, AMD에게 호기가 올 수 있다.

반면에, AMD에 공급할 것으로 알려진 GF, 삼성의 수율과 제조문제를 보면 이 둘의 결과는 어떻게 될지 미지수다

출처 : 보드나라

AMD, Zen기반 서버용 프로세서 공식 스펙

2016. 2. 18. 16:20

Zen기반 서버용 옵테론 프로세서가 8채널 32코어로 출시된다고 CERN 공식 문서에서 확인됐습니다.

기존의 Zen은 SMT(인텔의 Hyper Threading)기술을 이용하고, 14nm공정으로 출시됩니다. 또한, 아키텍처 개선으로 클럭당 성능이 기존 제품에 비해 40%가 증가한다고 발표했습니다. 그래서 AMD와 소비자의 기대가 작지 않습니다.

그런데 Zen을 기반으로 한 서버용 프로세서의 스펙 일부가 공개됐습니다.


이번에도 경쟁사보다 많은 코어수를 갖고 있는데요, 거기에 클럭당 성능도 증가하면서 또한 AMD의 큰 기대를 받고 있습니다.

CPU는 최대 32코어이고, 64쓰레드를 적용했고, DDR4 8채널을 지원한다고 합니다.

서버의 특성상 많은 코어가 필요하고 기존의 옵테론도 가격대비 많은 코어수로 가성비가 좋았습니다.

이번에도 경쟁사보다 많은 코어수를 갖고 있는데요, 거기에 클럭당 성능도 증가하면서 또한 AMD의 큰 기대를 받고 있습니다.

+ Recent posts