Обзор мобильной платформы AMD Trinity. Обзор мобильной платформы AMD Trinity Какую внешнюю карту потянет amd 10a 4600m
Эра технологий - Информационный сайт

Обзор мобильной платформы AMD Trinity. Обзор мобильной платформы AMD Trinity Какую внешнюю карту потянет amd 10a 4600m

Тест и обзор AMD A10 | APU AMD на базе Trinity

APU для десктопов на базе Llano AMD выпустила в 2011 году, и мы рассматривали их в обзоре "AMD A8-3850: обзор процессора Llano для недорогих настольных компьютеров" . То, что процессор ориентирован на десктопы подразумевает, что производительность его мобильных версий будет весьма высока. Мы по-прежнему впечатлены мощностью встроенного графического движка и временем автономной работы, и не сомневаемся, что с помощью Llano AMD отберёт у Intel определённую часть рынка.

Однако, если проанализировать продажи за 2011 год, становится видно, что изменения не так существенны, как могло показаться: по данным IDC (International Data Corporation) процессоры AMD установлены в 16 процентах всех ноутбуков, выпущенных за год. Получается, что с момента появления APU продажи возросли на 2,5%. Intel продолжает лидировать, её доля в мобильном сегменте составляет около 84%. Из 564 ноутбуков на Newegg , 108 на базе AMD (19%) и 456 используют платформы Intel (81%). Если архитектура Llano так хороша, почему их доля увеличилась так слабо?

Очевидно, что APU только набирают обороты на рынке мобильных устройств. Тем не менее, решение новое и заставить разработчиков писать софт по-новому очень тяжело, такое сопротивление мы видели, когда двух и четырёхъядерные процессоры постепенно начали вытеснять одноядерные. Кроме того, слабость Llano – это производительность ядер x86. Intel просто обходит AMD и в большом количестве тестов, и в реальных приложениях. Вспоминается последняя фраза из нашего обзора Llano: "… нам придётся дождаться Trinity , чтобы посмотреть, способна ли AMD выпустить APU, которое сможет одновременно и победить Intel по вычислениям, и выйти в лидеры по интегрированной графике. Такой процессор почти гарантировано будет более успешным, чем нынешний Llano."

Ну вот и дождались. AMD представила архитектуру Trinity , и хотя мы почти уверенны, что она обойдёт Intel по графике, нам больше любопытно увидеть, как AMD улучшила ядра x86. CPU Trinity основан на микроархитектуре Piledriver, которая нам знакома по линейке процессоров FX. Как мы выяснили в обзоре процессора AMD FX-8150 , его модульная концепция очень близка к чипам на базе архитектуры Sandy Bridge , которую впоследствии заменила . Мы приблизительно знаем, как AMD планировала доработать Bulldozer и маловероятно, что эти усилия сильно улучшат позиции AMD по сравнению с последними решениями Intel.

Тем не менее, когда в прошлом месяце мы были на Trinity Tech Day в Остине, AMD отметила несколько любопытных моментов. Естественно, презентация приводилась так, чтобы основные недостатки были как можно меньше заметны. Однако, в словах маркетинговых представителей AMD был смысл: бенчмарки не дают полную картину.

Конечно, не удивительно, что компания, чьи процессоры пытаются догнать конкурентов во многих тестах, говорит такое. И естественно, мы не согласны с утверждением, что объективные результаты сравнительных тестов не важны, напротив, они являются сердцем хорошего обзора. Однако из презентации мы взяли несколько основных идей: во-первых, если функция или технология не поддаётся тестированию или оценке в привычном нам виде, скорее всего, она не так важна, и не имеет значения насколько она влияет на производительность; во-вторых, надо учитывать, как люди используют свой ПК, и опираться на это при формировании наших выводов в обзорах.

Как нам кажется, оба аспекта можно принять во внимание при написании обзора про любое "железо". Конечно, они не должны относиться только к одному конкретному производителю, и мы ещё посмотрим, помогут ли данные утверждения AMD при формировании выводов о новых APU, или напротив, помешают.

Теперь, давайте поближе ознакомимся с новой архитектурой AMD, которую мы все с нетерпением ждали.

Тест и обзор AMD A10 | CPU на ядре Piledriver

APU объединяют в себе ядра x86 и графические ресурсы. Поэтому давайте начнём с исследования компонента, который обычно называется CPU.

Когда год назад нам представили APU Llano, мы уже знали, что архитектура Stars находилась на последнем издыхании. В будущем AMD планировала полностью перейти на дизайн Bulldozer, который мы увидели на десктопах только в прошлом октябре.

С премьерой Trinity ситуация обратная. Самая современная архитектура процессоров AMD вначале представлена в мобильном APU. Это обновлённый дизайн Bulldozer под названием Piledriver, который доберётся до настольных компьютеров ближе к концу этого года.

Какие главные отличия между ядрами Husky в архитектуре AMD Llano и Piledriver в Trinity ? Четырёхядерные APU Llano используют четыре отдельных исполнительных ядра, а четырёхядерные чипы Trinity два модуля Bulldozer. Каждый модуль содержит два исполнительных ядра. Недостаток в том, что они имеют общие блоки, которые в более традиционных многоядерных решениях дублированы, это блоки выборки и декодирования инструкций, блоки вычислений с плавающей запятой и кэш второго уровня. Напоминаем, что более подробно с архитектурой Bulldozer вы можете ознакомиться в обзоре "AMD FX-8150: от Bulldozer к Zambezi и FX" .

Наиболее очевидным отличием между десктопными процессорами FX и компонентом CPU в APU Trinity является кэш. Каждый модуль APU имеет 2 Мбайт кэша L2, а общего 8-Мегабайтного кэша L3 у Trinity нет, поэтому модульная архитектура суммарно содержит только 4 Мбайт кэша второго уровня, что соответствует характеристикам Llano.

Инженеры AMD ясно дают понять, что одной из важнейших целей в дизайне Piledriver было улучшение IPC по сравнению с Bulldozer. Об этом мы знали ещё после первой презентации Bulldozer, поэтому никого это не удивило. В процессорах серии FX прослеживалось существенное отставание по производительности на такт по сравнению с предшественником, и это необходимо было исправлять. Вместо того, чтобы делать упор на какой-либо один аспект, команда разработчиков использовала различные стратегии, что в результате подправило ситуацию.

Ниже перечислены основные улучшения ядра Piledriver:

Во-первых, модуль предсказания ветвлений был существенно пересмотрен и разделён на два уровня. AMD не сообщила каких-либо подробностей по этому вопросу, сказав лишь, что новый модуль улучшает загрузку конвейера, что способствует общему росту производительности.

В дополнение инженеры увеличили размер окна инструкций, чтобы можно было обрабатывать увеличенные группы. Это в свою очередь улучшает производительность и помогает более эффективно обрабатывать код системного уровня. К тому же было добавлено больше инструкций ISA, включая совмещённое умножение-сложение (FMA3) и 16-битную конвертацию с плавающей запятой (F16C). Архитектура Bulldozer уже поддерживает FMA4, поэтому включение FMA4 обеспечивает поддержку возможностей, которые Intel также представит в архитектуре следующего поколения. По словам AMD сократилось время исполнения инструкций, в результате чего ускорились операции с плавающей запятой и целочисленные вычисления.

Ещё одним ключевым компонентом производительности является подсистема памяти. Ранее мы видели, что важным недостатком архитектуры Bulldozer были высокие задержки у кэш-памяти. Инженеры AMD потратили немало сил для улучшения кэша L2 и аппаратной предвыборки, которые уменьшают задержки во время чтения данных из памяти. Потоковое прогнозирование тоже было улучшено по сравнению с предыдущим поколением APU.

Блок чтения/записи тоже подвергся оптимизациям с целью снижения задержек. Буфер быстрого преобразования адреса L1 (TLB) увеличен вдвое, то есть до 64 записей, чтобы избежать возможного увеличения задержки, так как увеличенный TLB обеспечивает более эффективную структуру. И наконец, планировщик работы с плавающей запятой и планировщик целочисленных операций были усовершенствованы для более эффективного использования всех аппаратных блоков, которые может предложить Piledriver.

Учитывая увеличение тактовой частоты (об этом мы поговорим чуть позже), AMD утверждает, что APU A10-5800K на базе Trinity на 26% лучше десктопного A8-3850 на архитектуре Llano, а A10-4600M на 29% лучше, чем A8-3500M для ноутбуков.

Все вышеупомянутые доработки весьма существенны, и мы будем иметь это ввиду во время проведения тестов. Но сначала, давайте разберёмся с графической частью Trinity .

Тест и обзор AMD A10 | Подробно о GPU (VLIW4 больше VLIW5)

Одни приложения могут работать с любым оборудованием, поддерживающим OpenCL, другие оптимизированы для функций AMD. Некоторые уже готовы, другим ещё только предстоит увидеть свет.

Во многих случаях улучшения качественные, а не количественные. В результате, мы не можем их протестировать. Об этом мы говорили на первой странице данной статьи и AMD надеется, что при выборе следующей покупки люди это учтут. Давайте рассмотри некоторые приложения, которые читатели смогут использовать.

AMD Steady Video

Steady Video – утилита улучшения видео в реальном времени, которая помогает понизить эффект дрожания. Она использует APP-ускорение. Смысл обработки будет понятен, как только вы увидите эту программу в действии. AMD выпустила плагины Steady Video 2.0 для IE, Firefox, Chrome и Windows Media Player.

Так ли она необходима? Есть ли преимущества перед Intel Quick Sync? Вряд ли. По сути, большая часть видеоконтента, который мы просматриваем, не является "любительской трясучкой". На самом деле мы даже не уверенны, работала ли она когда мы смотрели ролики. Как бы там ни было, новое приложение для технологии AMD, несомненно, интересно смотрится в действии. Если ввести в поисковике запрос "AMD Steady Video", то вы сможете найти множество демонстрационных роликов.

VLC Media Player

VLC Media Player – это открытый кроссплатформенный бесплатный мультимедиа-проигрыватель. AMD с умом поддерживает VLC, поскольку открытость проекта означает, что большое количество пользователей могут выиграть от поддержки ускорения. Оптимизации включают фильтр шумоподавления в реальном времени на базе OpenCL и поддержку AMD Steady Video. Эти дополнения нельзя назвать необходимыми функциями, но они разработаны для пользователей VLC, которые хотят их опробовать.

WinZip 16.5

Это, возможно, самая широко востребованная из доступных программа с поддержкой OpenCL, и наши тесты доказали, что ускорение оказывает существенное влияние на скорость сжатия. Кажется, AMD действительно выиграла от сотрудничества с Corel, хотя если разобраться в результатах более подробно, новый APU всё же не смог обойти Intel Sandy Bridge . Хотя данная функция подняла производительность A10-4600M вплотную к уровню Core i5-2450M. Однако ускорение выглядит не так впечатляюще, когда оно только уравнивает участников.

Тем не менее, OpenCL – это отраслевой стандарт. И поскольку для поддержки OpenCL AMD работает с Corel, обе компании блокируют Intel и Nvidia. Хотя фанаты AMD не против, если роли в спектакле поменяются, но будут и протестующие. Возможно, даже хорошо, что различия не так существенны.

Media Encode Acceleration – OpenCL и VCE

Arcsoft MediaConverter 7.5, CyberLink MediaEspresso 6.5 и x264 HandBrake (в следующей ревизии) могут выгодно использовать программируемые шейдеры AMD и логику с фиксированными функциями VCE для ускорения кодирования видео. Функция отлично подходит владельцам оборудования AMD. К сожалению, согласно данным наших тестов, производительность улучшается не так сильно, как с технологией Intel Quick Sync.

MotionDSP vReveal

Это приложение улучшает качество видео и отлично демонстрирует возможности AMD Steady Video и рендеринг с GPU-ускорением. Единственный недостаток данной программы, которая, кстати, базируется на профессиональном софте в том, что она решает очень специфические задачи и не применима для широкого круга пользователей. Тем не менее, если для улучшения качества вашего видео вы всё время работаете с vReveal, возможно, имеет смысл рассмотреть в качестве покупки APU или дискретную видеокарту от AMD.

Photoshop CS6

Photoshop CS6 использует около тридцати функций с GPU-ускорением включая плавление, трансформацию, искривление и размытие. В зависимости от того, какую работу вы проводите с помощью приложений Adobe, эти функции могут и вовсе не использоваться. Но если именно они вам и нужны, OpenCL-ускорение может сыграть важную роль. Конечно при условии, если GPU-ускорение работает на устройстве, поддерживающем OpenCL, включая движок Intel HD Graphics 3000, который мы сегодня тестировали. Из нашего опыта, фильтры в реальном времени, такие как плавление, быстрее работают на процессоре Core i5-2450M, а не на APU A10-4600M . Мораль такова: не думайте, что APU быстрее только потому, что приложения используют GPU-ускорение.

GIMP

GIMP – это ещё одна популярная открытая программа, которая позволяет редактировать изображения в стиле Photoshop, она тоже использует мощные функции и у неё немало поклонников. В будущем релизе предусмотрена поддержка девятнадцати фильтров с ускорением OpenCL. У нас не было времени протестировать её из первых рук и она пока недоступна в сети. Поэтому сказать что-нибудь конкретное о её работе мы не можем. Но приятно видеть в нашем списке приложение из обоймы open source.

Adobe Flash Player 11

Adobe Flash Player имеет огромную пользовательскую базу, и новая версия плагина поддерживает 3D-графику.

Мы просмотрели демо игры "Танки онлайн" и нового движка Unreal Engine 3, и были приятно удивлены уровнем детализации, который обеспечивает Flash плеер в окне браузера.

Не забывайте, что Adobe Flash Player ускоряется любым GPU, и хотя AMD APU выглядят сильнее мы заметили, что движка Intel HD Graphics 3000 также достаточно для воспроизведения демо, о которых мы упоминали.

AMD Quick Stream Technology

Данное приложения распределяет приоритет сетевого трафика и отдаёт самый высокий потоковому видео, минимизируя притормаживания. Идея отличная и мы ещё не видели утилит, разработанных специально для потокового видео. Стоит отметить, что раньше мы использовали утилиты, контролирующие приоритет пропускной способности сети, и впечатления остались положительные.

Качество изображения в играх

Для большинства игроков качество изображения - важная составляющая любой игры, и Intel здесь имеет плохую репутацию, предоставляя низкий уровень анизотропной фильтрации. Хотя на сайте SemiAccurate сообщают, что в ситуация значительно улучшилась, Sandy Bridge по-прежнему славиться ужасным качеством фильтрации.

Тест и обзор AMD A10 | Энергопотребление

В прошлом году в тестах с измерениями мощности APU Llano выглядел довольно хорошо, поэтому в этот раз нам очень интересно взглянуть на Trinity , особенно после всех разговоров AMD насчёт минимизации утечек. Несмотря на то, что производительность нового APU не превзошла Intel Core i5-2450M в тестах на реальных приложениях и тестах создания контента, для мобильной платформы это, в какой-то степени, может быть простительно, если APU обеспечит более длительную работу от батареи.

Мы проводили следующие тесты с подключённым внешним монитором, дабы убрать возможные колебания, связанные с дисплеем ноутбука. В момент тестирования ноутбук был подключён к розетке, а аккумулятор удалён.

Больше всех энергии во время интернет-сёрфинга потребляет платформа Llano. APU Trinity и Intel Sandy Bridge оказались гораздо эффективней.

Кроме того, энергопотребление у этих платформ примерно одинаковое. Вы заметили, как на последнем этапе теста линии стали прямыми? Здесь мы просматривали видео с YouTube. A10-4600M , похоже, потребляет меньше энергии при просмотре интернет-страниц, чем Core i5-2450M, но немного больше при воспроизведении потокового видео. A8-3500M потребляет больше всех электричества в обоих случаях.


Измерения энергопотребления системы при воспроизведении H.264-видео на разрешении 1080p подтверждает то, что мы видели в конце теста интернет-сёрфинга, хотя мы немного удивлены. AMD утверждает, что энергопотребление Trinity близко к Sandy Bridge при воспроизведении видео. Но наши результаты показывают, что APU потребляет больше энергии (хотя и меньше чем Llano). Мы специально удостоверились, что функции типа AMD Steady Video были выключены перед тестом, поэтому возложить на них вину за такую разницу нельзя.

Тест и обзор AMD A10 | Подводим итоги

Прежде чем перейти к заключению, давайте сравним общую производительность трёх решений.

Похоже что APU на архитектуре Trinity не смог выгнать Sandy Bridge с позиции лидера по производительности. Тем более он не сможет это сделать с , когда появятся ноутбуки с процессорами Core i5 третьего поколения. Но он, безусловно лучше, чем Llano.

Однако более важно то, что новый APU значительно увеличивает производительность графики. GPU Trinity намного лучше HD Graphics 3000 и архитектура сможет использовать этот запас преимуществ против движка HD Graphics 4000 у . Если вы любите компьютерные игры, вам вполне оправданно можно рекомендовать A10-4600M вместо Intel Core i5-2450M. С другой стороны, если вы не планируете играть на ноутбуке, лучше выбрать Core i5 на Sandy Bridge . В принципе, такой же вывод мы сделали по поводу архитектуры Llano.

Как и в жизни сделать правильный выбор не так уж легко. Есть множество других факторов, которые необходимо учитывать, например, выход ноутбуков с процессорами Core i5 на архитектуре ожидается буквально через пару месяцев. Средние по цене процессоры Intel на техпроцессе 22 нм тоже будут включать движок HD Graphics 4000, который, как мы считаем, станет первым серьёзным шагом против доминирования графики AMD. В дополнение ко всему, будет иметь более низкий тепловой пакет и чуть более высокую производительность в приложениях. У нас ещё не было возможности протестировать Trinity против Core i5, цена которых будет примерно одинаковой, но, в конце концов, различия между новыми чипами обоих компаний могут остаться на таком же уровне, который мы видим между старыми платформами. Мы поделимся с вами результатами, как только у нас появиться соответствующее оборудование.

А что насчёт возможностей, которые нельзя протестировать? Мы действительно впечатлены тем, что AMD приложила гораздо больше усилий для взаимодействия с разработчиками программного обеспечения для реализации GPU–ускорения в нескольких различных сегментах и играх, чем в прошлом году. Но есть одна проблема – ни одно из этих приложений не имеет универсального применения. Например, AMD Steady Video отлично стабилизирует дрожащее видео. Но что если у вас нет видео-материала такого качества, зачем нужна эта функция? Но мы всё равно поощряем стремление AMD распространять ускоренные графическим процессором приложения на более широкую аудиторию. Оптимизация GIMP, HandBrake, vReveal, WinZip и других приложений – это отличный способ продемонстрировать преимущества вычислительных оптимизаций. Есть два но: во-первых, мы хотели бы видеть более определённое влияние GPU-ускорения на производительность конкурирующих процессоров, которые не поддерживают его, и во-вторых, не хотелось бы видеть, как блокируется доступ остальных производителей к программным продуктам, которые должны существовать в открытой экосистеме.

И наконец, что насчёт рекомендаций для распространённых задач? Даже профессиональные пользователи тратят много времени на просмотр почты, интернет-сёрфинг, работу в Word и, конечно, игры. Честно говоря, в большинстве задач трудно проследить различия между вслепую сконфигурированными платформами от Intel и AMD. За исключением игр, где дизайн AMD Trinity действительно блистает.

Остается пара неотвеченных вопросов: как покажет себя Trinity против ноутбука на базе по схожей цене, и когда можно будет увидеть ноутбуки на архитектуре Trinity в продаже? Мы постараемся ответить на них как можно скорее.

Когда наступит время оправданий,
Что я скажу тебе?
Что я не видел смысла делать плохо
И я не видел шансов сделать лучше.
Видимо, что-то прошло мимо,
И я не знаю, как мне сказать об этом.
Недаром в доме все зеркала из глины,
Чтобы с утра не разглядеть
В глазах
Снов о чем-то большем...

Процессоры Trinity — очень интересная точка в развитии микропроцессорных архитектур AMD. Интересна она потому, что в ней наконец-то встретились два основных потока этого развития. Первый поток — любимая игрушка компании AMD последних лет, инициатива внедрения в процессоры высокопроизводительных графических ядер, Fusion.

Второй поток — новая, разработанная с чистого листа архитектура Bulldozer . Название которой, собственно, знаменует то, что весь мир насилия с ее помощью был успешно разрушен до основания. Если быть до конца точным, в данном случае мы имеем дело с немного улучшенной версией этой архитектуры, которая называется Piledriver.

Это название также символично. На русский оно переводится загадочным словом «копёр», а означает — строительную машину, предназначенную для установки свай. То есть теперь мы имеем дело с заветным «затем» и строительством «нашего, нового мира». В котором кое-кто должен стать всем, а кое-кто — ничем. Ну или хотя бы подвинуться с теплого местечка почти монополиста.

Разумеется, основная цель данного обзора - отчет о тестировании новой платформы AMD Trinity (если вы умудрились проскочить мимо теоретического обзора , то стоит исправить это упущение). Он приведен на второй странице, и особо нетерпеливые могут проследовать туда сразу. Однако в данном случае AMD обставила запуск новой платформы довольно нетрадиционно, так что более любознательных читателей мы приглашаем еще немного задержаться на странице первой.

Как обычно происходит официальный старт новой x86-платформы? Одновременно запускаются настольная и мобильная серия процессоров. А партнеры — производители конечного «железа» уже к анонсу готовят некоторое (обычно — изрядное) количество новых моделей материнских плат, компьютеров и ноутбуков на базе новинки. Журналисты заранее получают тестовые семплы из числа тех моделей, которые позже поступают в розничную продажу.

Прошлогодняя презентация Llano — традиционный вариант старта новой платформы

Или можно посмотреть на то, как действует компания Google, когда запускает новую версию операционной системы Android. Она выбирает наиболее продвинутого на данный момент времени производителя смартфонов (раньше это была компания HTC, теперь — Samsung). И заказывает ему разработку эталонного устройства, которое становится новой версией собственного гугловского смартфона Nexus. Предназначено оно не столько для продажи (хотя и для продажи тоже), сколько для того, чтобы показать, как должны, по мнению компании, выглядеть устройства.

А вот как действует в похожих обстоятельствах компания AMD. Во-первых, в этот раз она совершенно не обращает внимания на сегмент настольных компьютеров. А во-вторых, для демонстрации своей новой платформы она создает специальный ноутбук, который никогда не будет продаваться в магазинах, — AMD Pumori. Логично предположить, что именно такими видят будущие продукты на базе своей новой платформы в компании AMD. Так какое же оно, это будущее?

⇡ Тестовый ноутбук AMD Pumori

Если судить исключительно по AMD Pumori, будущее это не слишком веселое. Выглядит оно как бюджетный ноутбук с намеком на корпоративный стиль. Ноутбук сравнительно крупный для экрана с диагональю 14 дюймов и не блещет изяществом форм.

Корпус ноутбука почти полностью выполнен из стандартного пластика ABS+PC черного цвета. Поверхности практичные, матовые. Небольшие серебристые вставки на боках устройства сделаны из магниевого сплава. Во-первых, они несколько разнообразят невеселые чернопластиковые пустоши. Во-вторых — делают корпус более жестким и прочным.

Крышка ноутбука выполнена из штампованного алюминиевого листа. Она также серебристая — что в данном случае непросто углядеть, поскольку она почти полностью закрыта огромной черной наклейкой с логотипом AMD.


Крышка лотка оптического привода окрашена в неподходящий цвет и неаккуратно торчит из корпуса. Намек на то, что создавался AMD Pumori на основе уже существующего шасси, для которого по каким-то причинам не сумели подобрать полный комплект подходящих декоративных элементов.

Клавиатура обладает довольно удобной раскладкой. Форма клавиш не модная «чиклет», а близка к традиционной — еще одно напоминание о «корпоративных замашках» семпла. Клавиатурный блок закреплен крайне небрежно: даже при ударах средней силы он изрядно гуляет под пальцами. Мы рассказываем это исключительно для того, чтобы вы четко поняли: ноутбук изначально бюджетный по своей природе.

Очередная отсылка к корпоративным сериям: маленькая сенсорная панель с длинноходными кнопками мыши. Вместе с отсутствием мини-джойстика TrackPoint это еще одно напоминание, что Pumori принадлежит к самым низам корпоративного сегмента. В более продвинутые бизнес-ноутбуки производители по-прежнему устанавливают TrackPoint.

Разъемов в AMD Pumori достаточно много: есть четыре USB-порта, два из которых поддерживают USB 3.0, оба актуальных видеовыхода и даже ExpressCard.

Сложно сказать, действительно ли в AMD представляют себе эталонный ноутбук так, как выглядит Pumori. Надеемся, что это все-таки не так. Но не можем не заметить: устраивать первое знакомство с новой, действительно неплохой платформой на примере снятого с производства бюджетного ноутбука позапрошлого года выпуска — не самое умное, что можно сделать.

Понятно, что AMD — не производитель ноутбуков, а производитель платформ для них. И тем не менее компании стоило бы озаботиться не только тем, как устроены чипы, но и тем, как должен выглядеть конечный продукт, на них построенный. Ведь большинству потребителей совершенно безразличны технические детали — им надо, чтобы был красивый, удобный, превосходящий аналоги Продукт.

В AMD придумывание такого продукта изо всех сил спихивают на партнеров. В прошлый раз, с платформой Llano, результат был довольно неутешительным — на выходе мы получили как раз такие вот невеселые коробки, как AMD Pumori. Так, может быть, стоило сразу направить мысль производителей, покупателей, журналистов и остальных причастных в правильное русло?

Есть подозрение, что в AMD слишком привыкли к пребыванию в роли безнадежно отстающих на фоне уверенных бумажных побед в строчках презентаций. Привыкли настолько, что не могут перестроиться даже в тот момент, когда выпал хороший шанс победить по-настоящему — просто растерялись и не смогли придумать, как это сделать самым правильным образом. Впрочем, ситуацию еще не поздно исправить — надеемся, что AMD все-таки крепко ухватится за этот шанс, пусть и с некоторым опозданием.

Технические характеристики

AMD Pumori
Процессор AMD A10-4600M: 2,3 ГГц (до 3,2 ГГц в режиме Turbo Core); 2x2 Мбайт L2; четыре вычислительных ядра
Набор микросхем AMD A70M
Графический контроллер Встроен в процессор.
AMD Radeon 7660G: 384 потоковых процессора, 497 МГц (до 686 МГц в режиме Turbo Core), разделяемая память
Экран 14,0 дюйма, 1366х768;
Матовое покрытие, LED-подсветка (AU Optronics B140XW02 V4)
Оперативная память 4 Гбайт, DDR3-1600 (2+2 Micron)
Жесткий диск 128 Гбайт SSD (Samsung 830 Series — MZ7PC128HAFU-0DA00)
форм-фактор 2,5 дюйма
Оптический привод BD-ROM/DVD-RW (Philips — Liteon DS-6E2SH)
Разъем флеш-карт SD/MMC/MS
Интерфейсы 2 х USB 3.0
2 х USB 2.0
2 х eSATA (совмещен с USB 2.0)
1 x ExpressCard/34
1 x HDMI
1 x VGA
1 x RJ-45
1 x выход на наушники (mini-jack 3,5 мм)
1 x вход микрофона (mini-jack 3,5 мм)
Wi-Fi 802.11b/g/n (Broadcom BCM94313HMGB)
Bluetooth 3.0 (Broadcom BCM94313HMGB)
Сетевой адаптер 10/100/1000 Мбит/с (Realtek RTL8168D/8111D)
Звук IDT 92HD81B1X;
два динамика, микрофон
Питание Батарея из 6 элементов, 57,7 Вт*ч (5200 мА*ч, 11,1 В)
Блок питания 90 Вт (15-20 В, 5 А)
Прочее Металлическая крышка, веб-камера
Размер, мм 339x242x22-30
Масса, кг 2,14
Операционная система Windows 7 Ultimate SP1 (64 bit)

В данном случае мы имеем дело с четырехъядерным (то есть двухмодульным) представителем семейства Trinity, номинальная частота которого составляет 2,3 ГГц. Процессор поддерживает технологию динамического разгона AMD Turbo Core, и в этом режиме частота может подниматься аж до 3,2 ГГц.

Как вы наверняка уже знаете, в архитектуре Bulldozer/Piledriver кеш второго уровня закреплен не за отдельными ядрами, а за модулями, представляющие собой двухъядерные (или полутораядерные — как посмотреть) «кирпичики», из которых и строятся многоядерные процессоры AMD. В данном случае модулей два, соответственно, объем кеша L2 составляет 2х2=4 Мбайт.

Утилита CPU-Z так и не научилась корректно определять версию южного моста (или, как его называют в компании, FCH — Fusion Controller Hub). Так что придется поверить на слово: в AMD Pumori используется чип A70M (Hudson-M3), основной особенностью которого является поддержка USB 3.0.

Инженерный семпл AMD Pumori стал первым ноутбуком, попавшим в нашу тестовую лабораторию, который был оснащен памятью DDR3-1600 — двумя модулями по 2 Гбайт каждый.

И это, конечно, неспроста — в свой новый ускоренный процессор AMD встроила действительно мощное графическое ядро. Так что быстрая оперативка, из которой выделяется видеопамять, в данном случае просто необходима. Она имеет все шансы стать узким местом видеосистемы: ядро состоит из 384 потоковых процессоров (VLIW4, архитектура GCN до APU еще не добралась) и работает на частотах до 686 МГц — такой серьезной «молотилке» нужен толстый канал.

Встроенное в AMD A10-4600M графическое ядро называется довольно-таки пафосно: Radeon 7660G. Является ли такой высокий номер модели заслуженным — посмотрим в процессе тестирования.

Стоит сразу приготовиться к тому, что настолько серьезными графическими возможностями пока будут обладать лишь две старшие модели семейства AMD Trinity. В процессорах серий A8 и A6 будет задействовано меньше потоковых процессоров, а частоты в основном будут ниже.

⇡ Внутреннее устройство

С целью установления природы нашей сегодняшней тестовой платформы (да и просто для поддержания хорошей традиции) мы разобрали AMD Pumori. В принципе, о том, что это на самом деле за ноутбук, можно было догадаться и по внешности, но наклейки AMD сильно меняют восприятие экстерьера. Поэтому так сходу нам не удалось его опознать. Для создания Pumori в AMD воспользовались стареньким шасси Dell. Если конкретнее, то это уже давно снятая с производства модель Dell Vostro 3400 — изначально данный ноутбук разрабатывался под процессоры Intel Core первого поколения.

Ноутбук разбирается сравнительно несложно, но в процессе разбора изрядно раздражает переплетение шлейфов и значительное количество вспомогательных плат. Все-таки сейчас ноутбуки проектируют заметно аккуратнее.

Корпус устройства почти полностью пластиковый, только серебристые вставки по бокам выполнены из металла. Крышка также металлическая.

У данного шасси по большому счету есть ровно одной преимущество — достаточно просторный корпус.

Однако несложно заметить, что материнская плата занимает весьма немного пространства, так что все необходимое вполне можно было разместить и в более компактном шасси. Особенно если избавиться от оптического привода и всяких необязательных вещей вроде разъема ExpressCard, а SSD взять не в форм-факторе 2,5’’, а в миниатюрном mSATA.

Материнская плата действительно небольшая. А могла бы быть еще меньше — в данном случае на ней осталось незанятым место для внешнего графического адаптера. Система охлаждения тоже не сказать чтобы действительно серьезная и громоздкая. Ее, кстати, вполне хватает — ноутбук почти не нагревается даже при работе с графикой. А в простое практически бесшумен.

Так что Trinity вполне, вполне можно было установить в гораздо более компактный корпус. Автору этого обзора весьма подходящим вариантом демошасси для Trinity представляется ноутбук Sony VAIO Z . Этот вариант мог бы стать отменно наглядным: было два ядра — стало четыре; раньше внешняя графика была в отдельной коробочке док-станции, а теперь — прямо в корпусе ноутбука. Который весит меньше 1,2 килограмма, то есть даже легче, чем модные нынче ультрабуки.

В данном же случае преимущества APU совершенно не видны на поверхности. Pumori весит больше двух килограмм и столь велик, что внутри вполне поместился бы и дискретный графический адаптер (собственно, материнская плата на него и рассчитана). Чем это лучше любого другого бюджетного ноутбука? Разве что ценой — но ведь пока речь идет только о тестовой платформе, тут нет ценника.

Процессор A10-4600M APU

Количество ядер - 4.

Базовая частота ядер A10-4600M APU - 2.3 ГГц. Максимальная частота в режиме AMD Turbo Core достигает 2.7 ГГц.

Цена в России

Хотите купить A10-4600M APU дёшево? Посмотрите список магазинов, которые уже продают процессор у вас в городе.

Семейство

Показать

Тест AMD A10-4600M APU

Данные получены из тестов пользователей, которые тестировали свои системы как в разгоне, так и без. Таким образом, вы видите усреднённые значения, соответствующие процессору.

Скорость числовых операций

Для разных задач требуются разные сильные стороны CPU. Система с малым количеством быстрых ядер отлично подойдёт для игр, но уступит системе с большим количеством медленных ядер в сценарии рендеринга.

Мы считаем, что для бюджетного игрового компьютера подходит процессор с минимум 4 ядрами/4 потоками. При этом отдельные игры могут загружать его на 100% и тормозить, а выполнение любых задач в фоне приведёт к просадке ФПС.

В идеале покупатель должен стремиться к минимум 6/6 или 6/12, но учитывать, что системы с более чем 16 потоками сейчас применимы только в профессиональных задачах.

Данные получены из тестов пользователей, которые тестировали свои системы как в разгоне (максимальное значение в таблице), так и без (минимальное). Типичный результат указан посередине, в цветной полосе указана позиция среди всех протестированных систем.

Комплектующие

Мы собрали список комплектующих, которые пользователи наиболее часто выбирают, собирая компьютер на базе A10-4600M APU. Также с этими комплектующими достигаются наилучшие результаты в тестах и стабильная работа.

Самый популярный конфиг: материнская плата для AMD A10-4600M APU - Lenovo 10AB0010US, видеокарта - GeForce GT 420.

Характеристики

Основные

Производитель AMD
Дата выпускаМесяц и год появления процессора в продаже. 01-2015
ЯдерКоличество физических ядер. 4
ПотокиКоличество потоков. Количество логических ядер процессора, которые видит операционная система. 4
Базовая частотаГарантированная частота всех ядер процессора при максимальной нагрузке. От неё зависит производительность в однопоточных и многопоточных приложениях, играх. Важно помнить, что скорость и частота напрямую не связаны. Например, новый процессор на меньшей частоте может быть быстрее, чем старый на большей. 2.3 GHz
Частота турбо-режимаМаксимальная частота одного ядра процессора в турбо-режиме. Производители дали возможность процессору самостоятельно повышать частоту одного или нескольких ядер под сильной нагрузкой, благодаря чему скорость работы повышается. Сильно влияет на скорость в играх и приложениях, требовательных к частоте CPU. 2.7 GHz

Первое знакомство с новыми APU на примере модели A10-4600M

Компания AMD запустила свою марку VISION ещё в сентябре 2009 года, а в 2011-м компания представила так называемые APU (Accelerated Processing Unit), выпустив на рынок чипы AMD серий C и E на базе платформы «Brazos». Они объединили мощь GPU и CPU в одном кристалле, став одними из наиболее энергоэффективных ультрамобильных решений. А ещё позже в прошлом году AMD анонсировала серию A - платформу гибридных решений с кодовым именем Llano, которая была предназначена для основной части (mainstream) рынка ПК.

Предыдущие серии APU от компании AMD под названием Brazos и Llano были очень неплохо приняты рынком и оказались довольно успешными для компании. Они не хватали звёзд с неба в плане максимальной производительности (особенно в CPU части), но предлагали неплохой баланс: достаточно мощные для большинства пользователей универсальные вычислительные ядра и очень неплохую графическую производительность для интегрированных решений. Вместе с невысоким потреблением энергии это привело к выдающейся энергоэффективности первых APU.

И уже совсем недавно - 15 мая 2012 года - AMD представила обновленную серию A своих гибридных решений, ранее известную под кодовым именем Trinity, которая имеет улучшенные потребительские характеристики, по сравнению с Llano. Новые чипы сочетают два или четыре процессорных ядра «Piledriver», а также видеоядро серии «Northern Islands» с 384 вычислительными ядрами архитектуры VLIW4.

Главное преимущество APU - это высокая производительность в 3D играх. И платформа Trinity предлагает, пожалуй, лучшие возможности в своём ценовом диапазоне и при известных ограничениях потребления энергии. В новых APU было обновлено графическое ядро, теперь применяется более новая архитектура, известная нам по AMD Radeon HD 7600 (кодовое имя «Thames»). Новое видеоядро обеспечивает весьма высокую производительность, если сравнивать с другими гибридными (CPU+GPU) решениями.

Обновленная A-серия чипов включает до четырёх x86-совместимых вычислительных ядер, которые основаны на улучшенной архитектуре, впервые появившейся в процессорах «Bulldozer». А появление поддержки третьего поколения технологии AMD Turbo Core обеспечивает максимально возможную производительность CPU и GPU в условиях различной нагрузки и жёстких требований по энергопотреблению. При установленных рамках TDP, новая A-серия чипов отлично подходит для ультрапортативных и тонких ноутбуков, а также для домашних настольных ПК, хотя такие APU выйдут несколько позже. Сравним основные характеристики Llano и Trinity:

Новый чип производится по тому же 32 нм техпроцессу и имеет 1,3 миллиардов транзисторов в своём составе, что немногим больше, чем имеет Llano. Площадь кристалла равна 246 мм 2 , что также незначительно больше площади Llano. Для сравнения, четырёхъядерный Sandy Bridge от Intel также выполнен с применением 32 нм техпроцесса, он имеет почти столько же транзисторов и площадь кристалла, что и Llano (1,2 млрд. транзисторов и 216 мм 2 , соответственно). А вот в производстве Ivy Bridge уже применяется более совершенный техпроцесс 22 нм, и при сложности почти как у Trinity (1,4 млрд. транзисторов), этот процессор от компании Intel имеет значительно меньшую площадь в 160 мм 2 .

Преимущество компании Intel в скорости освоения техпроцессов неоспоримо, и без перехода на новый техпроцесс AMD пришлось урезать свои аппетиты в плане усложнения APU. По сравнению с Llano размер и сложность кристалла выросли незначительно, и производительность CPU и GPU частей, а также их энергоэффективность, хоть и выросли, но не так существенно, как могли бы при 28 нм производстве, к примеру. Но из-за улучшенной архитектуры и CPU и GPU, удалось повысить мощность Trinity, и этот APU является логическим развитием своего предшественника, и очень хорошим решением в целом.

Платформа Trinity

Итак, новая серия APU от компании AMD основана на чипе, состоящем из 1,3 млрд. транзисторов, выполненным на базе 32 нм HKMG техпроцесса, и имеющем площадь 246 мм 2 . Чип имеет два исполнения: FS1r2 722-контактный uPGA и FP2 827-контактный uBGA. Мобильный вариант Trinity имеет типичное потребление энергии (TDP) от 17 до 35 Вт, в зависимости от модели, а для настольных APU этот параметр достигает 100 Вт.

Новые чипы серии A имеют до четырёх x86-ядер, до 128 КБ кэш-памяти первого уровня (64 КБ для инструкций, 64 КБ для данных) и до 4 МБ кэш-памяти второго уровня. Тактовая частота «ноутбучных» моделей достигает 3,2 ГГц в турбо-режиме. Поддерживается оперативная память следующих типов: DDR3-1600 (1,5 В), LVDDR3-1600 (1,35 В), ULVDDR3-1333 (1,25 В) при работе в двухканальном режиме.

Графическое ядро содержит до 384 вычислительных ядер и обладает поддержкой DirectX 11 API, в состав чипа входят аппаратные блоки кодирования и декодирования видеоданных: UVD 3 и VCE. Интегрированный GPU в Trinity работает на частотах от 424 до 800 МГц. Для вывода изображения можно использовать до четырёх приёмников видеосигнала, поддерживаются выводы всех типов: Display Port, HDMI, DVI для трёх дисплеев, а четвёртый можно подключить по DisplayPort 1.2 при помощи специального хаба. Аналоговое подключение использует DAC, встроенный в чипсет.

К слову о применяемом чипсете. Новая платформа использует уже известный нам чипсет (Fusion Controller Hub) модели A70M (Hudson M3), который знаком по Llano. Чипсет пусть и не новый, производится по 65 нм техпроцессу, но он обеспечивает Trinity всем, что необходимо, поддерживая шесть SATA-III портов (с возможностью организации RAID 0/1 массивов), четыре USB 3.0 и 10 USB 2.0 портов (плюс два USB 1.1 дополнительных). Всё остальное из актуального также есть, а что до поддержки чипсетом «всего лишь» PCI Express 2.0, то в случае мобильных систем третья версия PCIe просто не нужна, так как толк от неё даже на настольных системах заметить пока что непросто. Потребление энергии чипом FCH небольшое - от 2,7 до 4,7 Вт в типичных условиях.

Вычислительные ядра Piledriver

Как вы наверняка помните, Llano APU имел четыре x86-ядра Stars, а Trinity включает два модуля Piledriver. Это улучшенные ядра по сравнению с Bulldozer, и они явно лучше тех CPU ядер, которые используются в Llano. В Piledriver подтянули некоторые слабые места Bulldozer, хотя в целом архитектура осталась той же.

Каждый модуль Piledriver содержит уже известную со времён Bulldozer комбинацию из двух целочисленных и одного ядра обработки данных с плавающей запятой. Каждое из целочисленных ядер имеет собственные планировщики, кэш-память первого уровня для данных и исполнительные устройства. Также модуль содержит и общее FP-ядро, обрабатывающее инструкции с плавающей запятой и использующее общую кэш-память.

Инженеры компании AMD модифицировали вычислительное ядро, чтобы увеличить количество исполняемых микропроцессором инструкций за такт (IPC). Сами по себе исполнительные устройства почти не изменились и стали лишь незначительно производительнее, по сравнению с Bulldozer, в некоторых операциях (таких как INT и FP деление). Более важным изменениям подверглись планировщики для целочисленных вычислений и вычислений с плавающей запятой, а также значительно улучшено предсказание ветвлений и предварительная загрузка (prefetching).

Увеличилась и эффективность использования кэш-памяти второго уровня, а L1 TLB стал большего размера. А ещё одним ожидаемым изменением в Piledriver стало обновление архитектуры набора команд (ISA) новыми инструкциями: FMA3 и F16C, в дополнение к AVX, AVX 1.1 и AES.

Технология Turbo Core 3.0

Технологии, автоматически повышающие частоту одного или нескольких ядер CPU, а также интегрированного GPU, в последнее время получили широкое распространение - теперь они есть почти везде. В Llano уже была поддержка технологии Turbo Core, но в Trinity она была значительно улучшена.

Turbo Core 3.0 поддерживает повышение частоты как для CPU ядер, так и для GPU части чипа, а в Llano могли ускоряться только первые (при наличии «свободного» энергопотребления, конечно), а графическое ядро в предыдущем APU работало всегда на базовой частоте. В Trinity же, если ядра CPU не используют весь возможный запас по потреблению (когда оно не превышает значение TDP), а GPU загружен работой, то частота работы последнего повышается. Для CPU ядер работает то же самое - если основная нагрузка идёт на одно из x86-ядер, то его частота возрастает до максимальной отметки, если энергопотребление не превышает установленного значения TDP - см. схему:

Схема управления в чипе отслеживает потребление питания всеми блоками, и в Trinity она была усложнена. В Llano, схема Turbo Core просто отслеживает лишь активность CPU и GPU, и повышает частоту CPU, если GPU не загружен работой, а в Trinity вычисляется потребление каждым блоком, исходя из их загрузки, а затем и температурный режим для них, причём точность этих расчётов достаточно высока. В результате, схема управления Turbo Core 3.0 позволяет быстрее и эффективнее управлять изменением частот, а вместе с этим растёт и общая энергоэффективность решения.

Кстати, многочисленные улучшения в эффективности и управлении питанием в Trinity привели к росту времени автономной работы. По заявлениям компании AMD, такие устройства способны проработать до 11 часов в режиме простоя. Общее среднее энергопотребление системы, включая и APU и чипсет (точнее - Fusion Controller Hub) составляет лишь 1-2 Вт в режиме простоя и всего 6 Вт в режиме просмотра видеоданных. Что получается на практике, мы проверили в одном из следующих разделов материала.

Интерфейс памяти и другие соединения

Главным теоретическим преимуществом APU является их гетерогенная архитектура Heterogeneous System Architecture (HSA), когда в едином кристалле содержатся CPU и GPU ядра, которые выполняют свои специализированные задачи, используя одну и ту же системную память, и связь между ними при этом может быть очень быстрой.

Пока что не всё это реализовано в нынешних чипах, но в ближайшем будущем станет важным преимуществом гибридных решений - одна только широкая начиповая шина между CPU и GPU облегчит многие задачи. Вот как видит AMD путь развития своих APU - если доступ к оперативной памяти у GPU уже есть, то в будущих моделях должна появиться общая адресация памяти, а также переключение контекста для GPU-вычислений:

Как и предшествующие APU, чипы Trinity содержат по два 64-битных контроллера DDR3 памяти, поддерживающих стандарты вплоть до DDR3-1866 (обеспечиваемая пропускная способность до 29,8 ГБ/с). Максимальный объём поддерживаемой памяти для мобильных чипов Trinity равен 32 ГБ, а для настольных - 64 ГБ. Из нововведений можно отметить разве что добавленную поддержку чипов памяти, работающих при пониженном до 1,25 В напряжении.

Ранее служащая для внешних соединений Hyper Transport была заменена на PCI Express. 128-битный двунаправленный интерфейс Fusion Control Link (FCL) предоставляет доступ к памяти для внешних устройств. Так, GPU с его помощью получает доступ к кэш-памяти и ОЗУ, а CPU - к выделенному фреймбуферу. Также в Trinity есть поддержка 256-битной двунаправленной шины Radeon Memory Bus (RMB) для прямого доступа к контроллерам DRAM памяти, а также для связи между CPU и GPU. RMB позволяет видеоядру получать быстрый доступ к системной памяти.

А для доступа дискретных GPU, используемых в паре с Trinity, напрямую к виртуальной памяти CPU, используется IOMMU v2. По сравнению со схемой в Llano, была упрощена передача данных в GPU, теперь не нужно копировать их из адресного пространства CPU в область ОЗУ, к которой есть доступ у графического ядра, теперь данные напрямую направляются из оперативной памяти в видеопамять, минуя лишнее копирование из одной области ОЗУ в другую.

Графическое ядро новых APU

GPU в Trinity имеет в своей основе архитектуру Cayman, впервые увиденную нами в семействе «Northern Islands». Встроенное в APU видеоядро использует VLIW4 дизайн и содержит 6 SIMD движков, в каждом из которых есть по 16 блоков VLIW4, то есть в сумме получаем 384 вычислительных ядра. Это число справедливо лишь для моделей A10, имеющих по 384 ядер, а чипы с маркировкой A8 и A6 имеют по 256 и 192 активных потоковых процессоров, соответственно.

«Northern Islands» можно назвать предыдущим поколением графической архитектуры AMD, хотя на её основе были выпущены лишь видеокарты для верхнего ценового диапазона - серия Radeon HD 6900. Недорогие варианты с VLIW4 так и не вышли. Интересно, что хотя Trinity имеет меньше вычислительных ядер в GPU, по сравнению с Llano, но переход от VLIW5 к VLIW4 повысил эффективность их использования, так как пятый блок VLIW5 был занят работой в крайне ограниченном круге задач - те же трансцендентные функции используют лишь 3-4 блока из имеющихся. Применение VLIW4 упростило и задачи планировщика и управления регистрами, что привело к дополнительному увеличению эффективности.

Кроме потоковых процессоров, GPU включает 24 текстурных блока (по 4 TMU на каждый SIMD) и 8 блоков ROP, то есть примерно четверть от Radeon HD 6970, если не учитывать более низкую частоту. Впрочем, турбо-частота графического ядра Trinity для топовых моделей равна 686 МГц, что не так уж далеко от 880 МГц у Radeon HD 6970.

Из других изменений между графическими архитектурами, применёнными в разных поколениях APU, особо отметим улучшенную производительность тесселяции в Northern Islands, а также поддержку всех известных типов полноэкранного сглаживания, в том числе SSAA, EQAA и MLAA. Естественно, что графическое ядро поддерживает DirectX 11 и OpenCL 1.1 - это одни из преимуществ AMD перед Sandy Bridge (но не Ivy Bridge). Подробнее о графической архитектуре Northern Islands можно прочитать в базовом обзоре Radeon HD 6970 .

Для вывода изображения на дисплеи используется хорошо известная технология AMD Eyefinity , новыми APU поддерживается до четырёх мониторов и независимых аудиопотоков, а также DisplayPort 1.2 выходы со скоростью передачи данных до 5,4 Гб/с и поддержкой многопоточного вывода. Нужно отметить, что новый APU включает также и ускоритель обработки медиаданных HD Media Accelerator, улучшающий качество видео (постобработка) и включающий блоки видеодекодирования UVD 3 и видеокодирования VCE.

Несмотря на то, что GPU в Trinity имеет архитектуру VLIW4, блок кодирования видео был позаимствован у более поздней архитектуры Graphics Core Next. UVD третьего поколения отличается поддержкой аппаратной обработки формата MPEG-4/DivX, а также возможностью декодирования двух каналов видео в формате FullHD, что применяется и при декодировании видеоданных в стереоформате.

Технологию для перекодирования видеоданных назвали AMD Accelerated Video Converter . Многопоточный аппаратный видеокодер в формате H.264 поддерживает разрешение до FullHD, цветовую дискретизацию 4:2:0, изменяемое качество сжатия и специализированные оптимизации для разных видов изображения. Обеспечивается быстрый доступ к данным из фреймбуфера для перекодирования видео, задач видеоконференций и беспроводной передачи изображения на внешний дисплей. Аппаратный блок VCE обеспечивает энергоэффективное кодирование видеоданных со скоростью быстрее реального времени и с низкими задержками.

Кроме этого, стоит отметить технологию улучшения качества проигрывания потокового видео - AMD Quick Stream Technology , а также технологию стабилизации видеоизображения в реальном времени AMD Steady Video. Quick Stream интересна тем, что трафику потокового видео на совместимых платформах AMD выделяется максимальный приоритет перед другими задачами, использующими сетевой канал. При этом достигается плавное воспроизведение потоковых видеоданных без ожидания их подгрузки.

Технология AMD Steady Video занимается улучшением видеороликов плохого качества, снятых с рук, без использования штатива и других аналогичных средств для стабилизации изображения. Технология стабилизации видео при помощи GPU поддерживается в решениях компании AMD уже некоторое время, но в серии видеокарт Radeon HD 7000 появилась её вторая версия.

Алгоритм работы программного стабилизатора довольно прост: на основе видеопотока собирается статистика о движении камеры (сдвиг, вращение, приближение) и это движение компенсируется в текущем кадре, относительно предыдущих - изображение сдвигается, поворачивается и масштабируется так, чтобы картинка сильно не прыгала и оставалась стабильной.

Задача хоть и несложная, но весьма ресурсоёмкая, ведь пикселей в кадре два миллиона, а кадров в секунду 30-60. И чтобы отследить все возможные смещения кадра, нужно проделать много вычислений. Графические ядра с поддержкой Steady Video 2.0 способны обрабатывать случайные сдвиги с амплитудой до 32 пикселей в любом направлении и для этого требуется поддержка специализированных команд, которая теперь есть и в последнем поколении APU.

Линейка новых мобильных решений серии A

Платформа Trinity выходит на рынок в двух видах, как и Llano. Настольные решения основаны на чипах Virgo, но они выйдут на рынок позже - ближе к осени. А пока что вышли модели APU для ноутбуков, имеющие кодовое имя Comal. Мобильные решения для AMD предпочтительны по многим причинам, тем более, что Trinity имеет преимущество в энергоэффективности, важной именно для ноутбуков.

Это заметно и по установленным цифрам типичного потребления энергии. Если Llano имели лишь два варианта с TDP в 35 Вт и 45 Вт, то мобильные Trinity имеют модели с потреблением: 17 Вт, 25 Вт и 35 Вт (для настольных ПК будут уровни 65 и 100 Вт). К тому же, по данным AMD, новое поколение APU почти вдвое более энергоэффективно, по сравнению с Llano. Всего мобильных чипов Trinity вышло пять разных моделей, нацеленных на разные рынки, и все они отличаются по своим потребительским характеристикам:

Модель Модель GPU Ядер CPU Частота CPU, ГГц Кэш L2, МБ Ядер GPU Частота GPU, МГц TDP, Вт
A10-4600M HD 7660G 4 2,3 (3,2) 4 384 497 (686) 35
A8-4500M HD 7640G 4 1,9 (2,8) 4 256 497 (655) 35
A6-4400M HD 7520G 2 2,7 (3,2) 1 192 497 (686) 35
A10-4655M HD 7620G 4 2,0 (2,8) 4 384 360 (497) 25
A6-4455M HD 7500G 2 2,1 (2,6) 2 256 327 (424) 17

Как мы уже отметили выше, Trinity использует модули, содержащие по два ядра Piledriver с одним общим FP-блоком (FP/SSE). Поэтому можно сказать, что чипы Trinity - это четырёхъядерные или двухъядерные процессоры. И хотя если считать по количеству FP-блоков, то «настоящего» четырёхъядерника не получается, но само по себе количество тех или иных исполнительных устройств не так важно, как общая вычислительная производительность.

И по сравнению с решениями Llano на базе старых ядер, частоты CPU части Trinity значительно выше, это касается и базовой частоты и турбо-частоты. Топовая модель A10-4600M имеет базовую частоту более чем наполовину выше, чем модель A8-3500M из семейства Llano, а её турбо-частота выше на треть. С другой стороны, конвейер ядра Piledriver длиннее, чем в модифицированных K10, что скажется в некоторых приложениях, и разница в производительности окажется не столь впечатляющей.

GPU часть Trinity также сильно отличается от того, что мы видели в Llano. Мы уже отметили, что старые APU использовали графическое ядро с архитектурой VLIW5, известное с моделей серии Radeon HD 5000, и разные модели APU имели по 400, 320 или 240 вычислительных ядер. В Trinity же применена VLIW4 архитектура, виденная в настольных моделях серии Radeon HD 6900, и число активных потоковых ядер в новых моделях чипов равно: 384, 256 и 192.

Но, несмотря на сниженное количество вычислительных устройств в GPU, благодаря увеличенной эффективности использования ресурсов в Trinity, а также значительно более высоким (более чем наполовину) рабочим частотам для GPU в Trinity, графическая производительность новых APU выросла ещё более серьёзно, чем производительность универсальных x86-ядер.

Компания AMD противопоставляет свои новые решения соответствующим моделям от компании Intel, исходя из предполагаемой розничной стоимости конечных устройств. Так, модель A10 позиционируется между Intel Core i5 и Core i7, A8 - между Core i5 и i3, A6 - чуть ниже Core i3, а младшая A4 должна быть чуть дороже ноутбуков с Pentium, но дешевле всех Intel Core.

Интересно, что компания AMD использует маркировку A10 для своих топовых моделей на базе Trinity, ведь раньше были только менее производительные модели с названиями A8 и A6. Это и понятно, ведь по данным компании, модель A10-4600M обеспечивает примерно на 56% большую производительность GPU части и на 29% большую скорость универсальных вычислений, по сравнению с A8-3500M. Правда, со второй цифрой непонятно, идёт ли речь о производительности CPU или всё же в том числе и об универсальных вычислениях, в которых помогает и GPU.

Модель A10-4600M стала наиболее мощным APU на данный момент, она предназначена для производительных ноутбуков среднего ценового диапазона, которые неплохо предназначены для не самых сложных игровых задач, а также других типичных применений. A8-4500M более чем на треть медленнее в терминах графической производительности, а универсальные вычислительные ядра немного потеряли в частоте, зато этот APU может использоваться в более дешёвых ноутбуках, хотя в играх ему будет уже заметно тяжелее. Ну а самый простой A6-4400M содержит лишь два универсальных CPU ядра, а GPU имеет примерно половину производительности от топового решения. Всеми моделями поддерживаются типы DDR3 памяти вплоть до DDR3-1600.

Две оставшиеся модели из новой линейки APU имеют пониженное энергопотребление и предназначены для использования в тонких ноутбуках вроде HP Sleekbook - то есть, по сути, аналогах ультрабуков на базе процессоров Intel. А соответствующие настольные процессоры Trinity, когда они выйдут на рынок, могут стать основой для компактных ПК новых форм-факторов.

Более мощный A10-4655M имеет лишь на десяток процентов меньшую CPU-производительность, по сравнению с A10-4600M, и на треть меньшую скорость обработки графики. При этом подобная мощь довольствуется потреблением лишь 25 Вт энергии! Для младшей ULV-модели A6-4455M показатель TDP ещё ниже - всего 17 Вт, что полностью совпадает с аналогичными моделями от Intel. Естественно, скорость CPU и GPU в этой модели сильно урезана - в ней есть лишь два ядра Piledriver и 256 процессоров в GPU, а частоты заметно снижены. Также необходимо отметить, что малопотребляющие модели потеряли поддержку DDR3-1600 памяти, обеспечивая работу памяти стандартов до DDR3-1333 включительно.

Примерные прикидки по производительности новых APU можно сделать по данным от компании AMD, которая сравнивает Trinity с Llano по энергоэффективности в графических и других приложениях отдельно:

Сложно сказать, что подразумевается под «Productivity» производительностью, а расшифровки AMD не даёт. Вероятно, в этой колонке учитывается и скорость в приложениях с поддержкой OpenCL-ускорения. Куда интереснее сравнительные тесты с конкурирующим Intel Core i7-2720QM в DirectX 9 и 10 играх:

Правда, и тут нет конкретных цифр, а только преимущество решения AMD, указанное в процентах. И вполне естественно, что оно достаточно велико, ведь процессор конкурента имеет устаревший GPU. Процессоры Intel вплоть до Ivy Bridge (мобильные версии которых ещё не вышли) имеют интегрированное графическое ядро без поддержки DirectX 11, и для достижения приемлемой производительности в современных играх, процессорам Intel поможет только установка дискретного ускорителя от NVIDIA, что повышает цену конечного решения. Особенно по сравнению с ноутбуками на базе APU от AMD, ведь они обеспечивают подобную скорость в 3D играх без применения дополнительных чипов.

Прототип ноутбука на базе AMD Trinity

Прототип мобильного решения на базе Trinity, который был предоставлен нам компанией AMD на мероприятии для прессы, проходившем в Остине, уже больше похож на конечное решение, чем это было раньше, например с Zacate . Хотя дизайн ноутбука и разрабатывался кем-то из известных производителей, он совершенно точно не предназначен для выхода на рынок, хотя своё предназначение он выполняет неплохо - сделать выводы о платформе на его примере вполне можно.

Такое решение - чуть ли не единственная возможность для журналистов познакомиться с новинкой ещё до того, как ноутбуки на её основе попадут в розничные магазины. При этом прототип вполне функциональный, и все обычные тесты на нём проходят отлично. Интересно, что на ноутбуке есть логотипы компании AMD: на крышке, под экраном и над клавиатурой. Так как ноутбук в таком виде не попадёт на рынок, то нет смысла разбирать применённые в нём конструктивные решения - модели, которые уже пошли в розницу, совершенно иные. Да это и к лучшему, так как уж слишком просто и неэлегантно прототип выглядит, в отличие от чемоданчика, в котором он был нам выдан:

Из технических параметров, которые стоим упомянуть, отметим разве что модель APU - это A10-4600M со стандартными параметрами, которые указаны выше. Прототип ноутбука от AMD имеет приличную начинку в виде 4 ГБ памяти и SSD, достаточно ёмкую батарею и даже оптический Blu-ray комбо-привод. Конечно, он далеко не такой тонкий, как ультрабуки, но это и понятно - у прототипа просто не было такой цели. Давайте рассмотрим технические характеристики рассматриваемой сегодня модели:

Прототип AMD Trinity
Процессор AMD A10-4600M (2,3 ГГц (Turbo Core до 3,2 ГГц), 2×2 МБ L2, 4 ядра/4 потока)
Чипсет AMD A70M (Hudson M3)
Оперативная память 4 ГБ DDR3-1600, двухканальный доступ
Экран 14″, разрешение 1366×768, матрица TN, LED-подсветка
Видеоадаптер Интегрированный в APU Radeon HD 7660G (1 ГБ выделенной DDR3-памяти)
Накопитель SSD Samsung 830 (128 ГБ, SATA-III)
Оптический привод BD-Combo PLDS DS-6E2SH (SATA-II)
Средства коммуникации Gigabit Ethernet (10/100/1000 Мбит/c), Bluetooth 2.1, Wi-Fi 802.11b/g/n
Аккумулятор литиево-полимерный шестиячеечный, ёмкостью 56 Вт·ч
Операционная система Microsoft Windows 7 Ultimate (64-битная)

Как видите, A10-4600M работает на частоте 2,3 ГГц и имеет возможность автоматического разгона до 3,2 ГГц (когда работой загружено лишь одно из имеющихся вычислительных ядер) при помощи технологии Turbo Core 3.0, а также кэш-память второго уровня объёмом 2 МБ на каждый двухъядерный модуль. Посмотрим, что интересного сможет рассказать нам диагностическая утилита CPU-Z о применяемом центральном процессоре и системе:

Ничего особенно интересного мы не заметили - утилита уже умеет определять и характеристики чипов платформы Trinity. Данные о кэш-памяти и поддерживаемых расширениях, количество физических и логических процессоров указано верно. Частота x86-ядер показана в состоянии простоя, а чипсет определился как A55/A60M.

APU имеет сравнительно высокую частоту и четырёх (или двух, смотря как считать) имеющихся ядер должно вполне хватать для большинства обычных задач, вроде офисных приложений и браузеров, кроме наиболее требовательных вычислений вроде профессиональных применений в 3D-моделировании или видеомонтаже. Да и в большинстве современных игровых приложений скорости CPU должно хватать.

В оснащение прототипа ноутбука включили 4 ГБ памяти типа DDR3, что вполне обычно для ноутбуков такого класса. Для хранения данных ноутбук AMD укомплектован быстрым, хотя и не слишком ёмким твердотельным накопителем от Samsung. Так что беспокоиться по поводу скорости загрузки и работы системы не нужно - SSD обеспечит быстрый доступ к данным и не станет ограничителем производительности.

Ещё одной важной аппаратной особенностью прототипа является интегрированная видеоподсистема, имеющаяся в составе процессора A10-4600M. Несмотря на то, что это встроенное решение, оно весьма мощное и энергоэффективное, и должно обеспечить 3D-производительность на уровне некоторых дискретных видеокарт, особенно если сравнивать с прошлыми их поколениями. А уж сравнивать с интегрированным видео от той же Intel так и вовсе неверно, так как в тех же Sandy Bridge игры если и запускаются без проблем и артефактов, то интегрированные GPU неспособны обеспечить приемлемый FPS в них даже при низких настройках.

Посмотрим, что о характеристиках графического ядра прототипа на базе Trinity сможет рассказать тестовая утилита GPU-Z:

Radeon HD 7660G

Эта утилита предназначена скорее для работы с настольными ускорителями, а в случае мобильных решений она часто показывает неполные и/или неверные данные. Так получилось и в нашем случае - много что не определено вовсе, а то, что есть не всегда указано верно. Так что показания утилиты в данном случае фактически бесполезны, ведь даже поддержку DirectX 11 и OpenCL утилита показать не смогла.

Всё остальное в предоставленном прототипе ноутбука нас волнует в гораздо меньшей степени. Коммуникационные возможности его не слишком впечатляющие, но необходимый набор интерфейсов есть: сетевой адаптер Gigabit Ethernet, беспроводные интерфейсы Wi-Fi 802.11b/g/n и Bluetooth 2.1 (даже не 3.0, как ни странно). На то он и прототип. Давайте лучше перейдём к исследованию производительности нового APU.

Производительность в синтетических тестах

Как всегда, мы начинаем рассматривать производительность с синтетических тестов, которые показывают скорость в искусственных условиях, позволяя довольно чётко ограничить влияние различных подсистем друг на друга: CPU от GPU и наоборот. В этом разделе статьи мы рассмотрим результаты синтетических тестов производительности системы в следующих тестовых пакетах: PCMark Vantage, Cinebench, 3DMark’06 и ’11, а также Heaven 3.0.

Для начала давайте посмотрим на рейтинги производительности в операционной системе Windows 7. Это наиболее простой метод определения производительности в синтетических условиях, доступный на каждой системе с установленной Windows 7 или Vista. Для сравнения мы взяли ранее протестированные по данной методике мобильные системы компаний Acer и ASUS , а также инженерный образец AMD Zacate .

Рейтинг Windows 7 AMD
Trinity
(A10-4600M
HD7660G)
Acer
M3
(i5-2467M
GT640M)
Acer
5943G
(i7-720QM
HD5850)
ASUS
K52Jr
(i3-350
HD5470)
AMD
Zacate
(E-350
HD6310)
Процессор 6,9 6,3 7,0 6,3 3,8
Оперативная память 5,9 5,9 7,5 5,5 5,0
Графика Aero 6,7 5,7 6,9 5,1 4,0
Графика игровая 6,7 6,9 6,9 5,9 5,5
Жесткий диск 7,6 5,9 5,9 5,8 7,9

Встроенный тест Windows показывает, что производительность x86-ядер новой платформы Trinity весьма неплоха и примерно соответствует той, что получается у хоть и не нового, но всё же четырёхъядерного Core i7, кроме скорости доступа к данным из памяти, которая зависит от объёма и скорости кэш-памяти. Интересно, что A10-4600M оказался быстрее и «ультрабучного» Core i5-2467M. Ну а в тесте накопителя лидируют две тестовые системы от AMD, что объясняется применением в них полноценных SSD-накопителей, в отличие от HDD и гибридных систем у других участников теста.

Нас интересуют больше всего оценки графической производительности, и тут новый APU показал себя исключительно с хорошей стороны. В режиме «игровой» 3D-графики им был показан результат, почти соответствующий скорости таких быстрых решений, как AMD Radeon HD 5850 из позапрошлого поколения и новейшего NVIDIA GeForce GT 640M. Да и в графическом подтесте Aero отставания от указанного Radeon почти нет, а менее производительное интегрированное видеоядро Intel.

Впрочем, ничего особенного от встроенного в Windows теста мы не ждали, ведь он далёк от идеального, особенно в определении 3D-производительности, к которой мы ещё вернёмся не раз. А сейчас рассмотрим результаты общесистемного теста PCMark Vantage. Примем во внимание и итоговый результат, и отдельные по подсистемам. Подробные цифры помогут нам оценить производительность различных компонентов ноутбука, и их вклад в общую оценку.

PCMark Vantage AMD
Trinity
(A10-4600M
HD7660G)
Acer M3
(i5-2467M
GT640M)
Acer
5943G
(i7-720QM
HD5850)
ASUS
K52Jr
(i3-350
HD5470)
AMD
Zacate
(E-350
HD6310)
PCMark Score 10056 6106 5632 4445 3680
Memories Score 5834 4624 4134 2916 2240
TV and Movies Score 4004 2639 4029 3242 1595
Gaming Score 7272 8316 5788 3648 3722
Music Score 11570 8489 4599 4659 4916
Communications Score 9973 8181 4017 3717 3024
Productivity Score 12354 8434 4391 4087 4582
HDD Score 22013 15381 3072 2760 13809

Общий счёт в этом тесте важен скорее для энтузиастов разгона и годится разве что для сравнения рекордных результатов - забавно, что система A10-4600M оказалась чуть ли не вдвое быстрее всех. Пользы и практического смысла в таком сравнении нет, а вот подробные результаты бывают интересны, так как они сразу указывают на сильные и слабые стороны протестированных решений.

Так, в подтесте оперативной памяти новая платформа от AMD на удивление стала самой быстрой, обогнав все остальные тестовые системы. Вероятно, в этом виновата довольно быстрая DDR3 и неплохое кэширование. Результат в «TV and Movies» нормальный, на уровне четырёхъядерного ноутбука Acer, а огромная разница в остальных системных тестах в пользу сегодняшнего прототипа объясняется применением в нём SSD в качестве единственного накопителя - именно поэтому во многих тестах были показаны столь сильные результаты. Впрочем, без достаточно мощного центрального процессора их бы тоже не было.

Самый интересный «игровой» тест, в нём был получен результат между Radeon HD 5850 и GeForce GT 640M, причём ближе к последней. К сожалению, объективной эта оценка быть не может, так как сравнение портится присутствием SSD в некоторых конфигурациях, а в Gaming Score считается усреднённая оценка, замеряющая в играх и скорость загрузки данных с накопителя в том числе. И PCMark Vantage в целом слишком сильно зависит от скорости установленного накопителя.

Следующим рассмотренным тестом будет Cinebench старой версии R10, которую мы применяли с 2010 года. Это не совсем «чистая» синтетика, а скорее тест производительности, основанный на коде широко распространённого приложения Cinema 4D - профессионального пакета для создания и рендеринга трёхмерных изображений и анимаций.

Cinebench содержит три подтеста: рендеринг при использовании одного ядра CPU, всех ядер CPU (в данном случае выполняется четыре потока на двух ядрах) и самый интересный для нас подтест OpenGL, использующий рендеринг сложной трёхмерной сцены в реальном времени. Последний тест позволяет оценить производительность графической подсистемы при работе в аналогичных профессиональных пакетах, использующих OpenGL.

Cinebench R10 AMD
Trinity
(A10-4600M
HD7660G)
Acer M3
(i5-2467M
GT640M)
Acer
5943G
(i7-720QM
HD5850)
ASUS
K52Jr
(i3-350
HD5470)
AMD
Zacate
(E-350
HD6310)
CPU 2824 3581 3769 2495 1162
CPU (многопоточный) 8227 7133 10339 5788 2226
OpenGL 5597 5061 6860 4114 1960

Рассмотрим процессорные тесты Cinebench для начала. Рассматриваемый нами сегодня APU имеет четыре целочисленных ядра и два FP-ядра, прирост производительности от «многоядерности» в этом тесте получился почти трёхкратным, даже несмотря на влияние Turbo Core, который портит прямое сравнение. В случае процессоров Intel им помогал Hyper Threading, позволяющий выполнять четыре потока на двухъядерном процессоре и восемь на четырёхъядерном.

Весьма любопытно сравнение с Core i5-2467M. Если в однопоточном тесте выигрывает решение Intel, имеющее более производительное x86-ядро, то в многопоточном вперёд вырывается уже новинка от компании AMD - A10-4600M, имеющее большее количество ядер. То есть, само по себе каждое ядро в Trinity медленнее, но за счёт их количества получается выигрыш.

Интересен и подтест OpenGL, результаты которого говорят о том, что хотя Radeon HD 7660G и уступает мобильной версии Radeon HD 5850, но новый GeForce GT 640M остаётся позади в этом тесте, так как этот тест не является сильной стороной видеокарт NVIDIA. В общем, топовая модель чипов A-серии показала себя в Cinebench весьма неплохо.

А теперь давайте рассмотрим результаты 3DMark’06, где разница между графическими решениями различной мощности должна быть более ощутимой. Этот тест очень сильно нагружает почти исключительно видеоподсистему и зависит только от её производительности. Приведём цифры, относящиеся к тестированию именно GPU:

3DMark’06 AMD
Trinity
(A10-4600M
HD7660G)
Acer M3
(i5-2467M
GT640M)
Acer
5943G
(i7-720QM
HD5850)
ASUS
K52Jr
(i3-350
HD5470)
AMD
Zacate
(E-350
HD6310)
Score 7955 10504 9210 4047 2011
GT1 23,9 40,6 27,1 10,7 5,4
GT2 24,9 36,8 31,5 12,2 6,2
HDR1 34,8 48,3 38,9 15,9 8,1
HDR2 36,8 51,5 42,8 17,8 9,0

Хорошо видна разница в скорости между старыми ноутбуками и более современными, у которых цифры средней частоты кадров в тестах этого пакета уже вполне приемлемы. Даже столь мощный некогда мобильный Radeon HD 5850 лишь совсем немного обгоняет представленную недавно новинку - гибридное решение платформы Trinity. А для других встроенных в CPU графических ядер этот тест и вовсе слишком тяжёл, что можно увидеть на примере видеоядра AMD Zacate, а ведь GPU в Sandy Bridge ещё слабее.

Radeon HD 7660G справляется с задачей очень хорошо, обеспечивая скорость смены кадров порядка 25-35 FPS. Конечно, это меньше, чем у той же GeForce GT 640M, ну так на то она и дискретная графика, потребляющая вместе с CPU уже намного больше, чем A10-4600M в одиночку. Вообще, общий счёт 3DMark’06 обычно хорошо отражает производительность разных GPU. GT 640M в тесте явно лучший, затем идёт Radeon HD 5850, а почётное третье место занял наш сегодняшний герой, и это - отличный результат для гибридного процессора!

Всё это были старые синтетические тесты, результаты в которых мы привели для того, чтобы сравнить их с ранее протестированными моделями ноутбуков. С тех пор прошло много времени, вышли новые тестовые пакеты, более актуальные для оценки производительности современных видеокарт. Первым современным тестом будет 3DMark’11 всё той же Futuremark.

3DMark’11 AMD Trinity
(A10-4600M
HD7660G)
Acer M3
(i5-2467M
GT640M)
Score 1153 1773
Graphics 1062 1697
Physics 2642 2724
Combined 960 1494
GT1 5,28 8,27
GT2 5,07 7,94
GT3 5,93 10,26
GT4 3,22 5,06

Сравнивать результаты AMD A10-4600M в данном пакете мы будем только с цифрами недавно протестированного игрового ультрабука Acer Timeline Ultra M3, имеющего дискретную видеокарту GeForce GT 640M от NVIDIA. Потому что это первые мобильные решения, которые мы протестировали в тестовом пакете 3DMark’11.

Результат системы на базе Trinity APU в 3DMark’11 с общим счётом 1153 очков при настройках по умолчанию примерно соответствует уровню настольной видеокарты GeForce GT 430 и в полтора раза хуже, чем у AMD Radeon HD 6670. Хотя это и не такая уж высокая производительность с точки зрения настольных решений, но отличный уровень для интегрированного мобильного решения.

Производительности Radeon HD 7660G вполне хватит во многих современных играх, особенно мультиплатформенных и с не самыми высокими настройками. Но что будет в игровых приложениях, активно использующих такие возможности DirectX 11, как тесселяция, вычислительные шейдеры и др.? Чтобы это узнать, мы протестировали прототип на Trinity ещё в одном из наиболее тяжёлых 3D-тестов - Unigine Heaven 3.0.

Кроме тестов тесселяции в трёх режимах, мы также протестировали и разные уровни полноэкранного сглаживания методом MSAA и определили падение производительности при включении анизотропной фильтрации. Для удобства все результаты приведены в виде диаграммы:

Даже при пониженной сложности шейдеров, тест Heaven весьма тяжёл для ноутбуков, и уж тем более интегрированной графики. Но Radeon HD 7660G справляется с ним не так уж плохо, обеспечивая почти 30 FPS в режиме с выключенными сглаживанием, анизотропной текстурной фильтрацией и тесселяцией, а включение анизотропной фильтрации просаживает среднее количество кадров в секунду на 5%.

Посмотрим, насколько сильно падает производительность при включении полноэкранного сглаживания методом мультисэмплинга (MSAA). Конечно же, в данном случае скорость рендеринга снижается ещё сильнее, и в случае 8x MSAA падение FPS особенно велико, но уровень 2x не так уж тяжёл для графического ядра Trinity и, скорее всего, это решение сможет обеспечить играбельную частоту смены кадров в нетребовательных играх даже с включенным мультисэмплингом.

Тесселяция снижает производительность интегрированного в A10-4600M видеоядра даже ещё сильнее, поэтому вряд ли получится поиграть в DirectX 11 игры на ноутбуке с интегрированной графикой. Но почти то же самое наблюдается и в случае гораздо более мощных решений, даже минимальный уровень тесселяции значительно снижает скорость рендеринга. Что же, ничего нового - экстремальные настройки явно не для таких мобильных решений.

А мы переходим от неоднозначных общесистемных и синтетических тестов, показывающих иногда довольно странные результаты, к тестированию нового мобильного APU компании AMD, в наборе реальных игровых приложений, как современных, так и давно применяемых в наших исследованиях производительности.

Производительность в различном ПО

В предыдущих статьях, посвящённых гибридным системам компании AMD, мы часто задавались вопросом, когда же вычисления на GPU начнут применяться в программном обеспечении, которое часто применяется обычными пользователями, ну хотя бы их частью? В играх ведь вычисления на GPU уже используются, и в виде PhysX и в виде постобработки на DirectCompute. Долгое время ничего кроме игр, по сути, и не было.

Для научных вычислений и некоторых других задач вычисления на GPU давно имеют большое значение, но не для среднестатистического пользователя. Кодированием видео мало кто занимается самостоятельно, перекодированием из формата в формат тоже. Ну и монтаж с кодированием собственных видеороликов туда же - далеко не все тратят своё время на это.

В общем, тогда мы делали вывод о том, что хотя GPU-вычисления выглядят весьма перспективным направлением, но на тот момент толка от вычислений на GPU не было почти никакого. Но появление APU и других гибридных чипов дало дополнительный толчок для развития и появления такого ПО. Возможность параллельных вычислений появилась у большой части систем, не только ориентированных на игры и располагающих дискретными видеокартами. Да и развитие открытого стандарта OpenCL также помогло в увеличении числа применений вычислений на графических ядрах. Что же, давайте посмотрим, что сейчас нам предлагают вычислять на GPU

Мы давно знаем, что одной из первых реализованных задач GPGPU является обработка и кодирование видеоданных. Но развитие видеокодеров не стоит на месте, в будущих версиях известного кодека x264, который считается наиболее популярным среди H.264-кодировщиков и используется во множестве приложений, ожидается появление OpenCL-ускорения. Ну а пока что рассмотрим то ПО, где такое ускорение уже реализовано в том или ином виде.

Например, ArcSoft MediaConverter 7.5 - мощный, но простой в использовании конвертер медиафайлов. С его помощью можно легко сконвертировать видеофайлы для использования в телефонах, плеерах и других устройствах. Последние версии этого пакета используют возможности аппаратного кодера VCE видеокарт Radeon (включая тот, что есть в Trinity) при перекодировании видео - при перекодировании в формат устройств, поддерживающих H.264.

Ещё одно приложение этой же компании - Link+ 3. Это приложение для удобного доступа к мультимедийным данным (фотографии, музыка, видео) с любого устройства локальной сети. Link+ 3 автоматически объединяет возможности сетевых устройств и позволяет просматривать с них медиафайлы. Нас больше интересует поддержка технологий AMD: UVD при просмотре, VCE при перекодировании, HD Media Accelerator - для плавного и качественного воспроизведения. Технология ArcSoft SimHD использует возможности универсальных вычислений на GPU при масштабировании видео, а при его просмотре используется стабилизация при помощи Steady Video.

Есть и другие аналогичные приложения, вроде CyberLink MediaEspresso. Версия 6.5 поддерживает возможности аппаратной конвертации видео - AMD Accelerated Video Converter, используя блок VCE при транскодировании. А CyberLink PowerDirector 10 ещё более продвинут, его основной компонент - видеодвижок TrueVelocity 2, который оптимизирован для использования возможностей современных GPU компании AMD.

Это приложение также использует возможности Accelerated Video Converter при транскодировании (блок аппаратного декодирования UVD и кодирования VCE) и OpenCL-ускорение для дополнительных эффектов, таких как: Zoom In, Gaussian Blur, Color Focus и др.

Кроме приложений для обработки видео, продвинутые возможности GPU используются в медиаплеерах вроде ArcSoft TotalMedia Theatre 5. Пятая версия поддерживает OpenCL-ускорение уже упомянутой выше технологии ArcSoft SimHD, которая включает масштабирование, удаление шума, динамическую контрастность и конвертацию частоты кадров. Кроме этого, используются возможности аппаратного блока декодирования видео UVD 3 и технологии AMD HD3D для просмотра видео в стереоформате.

Почти всё это ПО по конвертации и просмотру видео уже было ранее известно. Куда интереснее приложения тех компаний, которые ранее не ускорялись при помощи графических чипов. Так, из приложений компании Adobe можно отметить Flash, где мощность GPU используется в трёхмерных приложениях, а современные версии Flash (начиная с 11.2) поддерживают очень обширные возможности для аппаратного ускорения 3D графики.

Но гораздо больше интересна совсем свежая версия графического пакета Adobe Photoshop CS 6, предлагающего возможности аппаратного ускорения на GPU для некоторых из своих функций при помощи OpenCL и OpenGL. И если с OpenGL-ускорением мы уже какое-то время были знакомы, то использование OpenCL появилось в CS6 впервые. Всего в новой версии графического пакета ускоряются более чем 30 функций, включая Liquify, Transform и Warping.

Новый движок Mercury Graphics Engine отображает результат сразу же - практически в реальном времени. А возможности OpenCL используются для ускорения вычислительно-интенсивных эффектов «Blur». Настройка ускорения на GPU «Use Graphics Processor to Accelerate Computations» включена по умолчанию. Из других GPU-ускоренных инструментов новой версии Photoshop CS6 отметим фильтр «Oil Paint», адаптивную коррекцию перспективы (для широкоугольных объективов), галерею эффектов освещения, а также инструменты трансформации и варпинга.

Фильтр Liquify ускоряется при помощи OpenGL, и в версии CS6 он полностью переделан для использования Mercury Graphics Engine в процессе загрузки, предпросмотра и итогового рендеринга. При программной обработке фильтром крупных изображений в Photoshop CS5.5 работа была заметно менее комфортной, а теперь применение фильтра практически не тормозит. Если говорить о конкретных цифрах, то AMD A10-4600M при включении GPU-ускорения более чем вдвое быстрее справляется с этой работой, и быстрее конкурирующих решений от компании Intel.

Новая галерея эффектов «Blur» предоставляет возможность быстрого применения сложных эффектов вроде Field Blur, Iris Blur и Tilt-Shift - имитация соответствующего типа объективов, когда задаётся область фокусировки, а остальное изображение замыливается. Это новая возможность, появившаяся в Photoshop CS6, она использует OpenCL при финальном рендеринге. В результате, тот же A10-4600M обеспечивает 7-кратный прирост в скорости при включенном GPU-ускорении, да и в целом заметно быстрее конкурирующих платформ, не имеющих поддержки OpenCL.

Это всё была теория лишь с несколькими цифрами, а что же получается на практике? Насколько сильно ускоряет вычисления графическое ядро в чипах Trinity? Давайте рассмотрим несколько приложений с использованием GPU. Первым будет vReveal 3.3 от MotionDSP - это простое и мощное средство для организации, простого редактирования и улучшения качества видеороликов.

Одной из наиболее интересных возможностей является функция «One-Click Fix», которая автоматически улучшает качество видеоролика, исправляя такие недостатки, как низкую контрастность, неверные цвета (баланс белого), а также стабилизирует видео. Поддерживается аппаратное кодирование видео при помощи Accelerated Video Converter и HD Media Accelerator, а OpenCL используется в других операциях.

Мы протестировали время «рендеринга» коротенького видеоролика высокого разрешения в программе vReveal, применив к ней то самое автоматическое улучшение качества. На выходе ролик действительно стал более плавным и стабилизированным, также улучшилась контрастность и насыщенность цветов. Но что со скоростью, что даёт применение GPU в этой задаче?

MotionDSP vReveal CPU GPGPU
Время операции 5:35 0:56

Как видите, разница в производительности обработки видеоролика оказалась весьма большой - с помощью GPU система справилась с обработкой ролика в 6 раз быстрее, чем при использовании только x86-ядер. Результат очень хороший, так как обработка видео отлично распараллеливается и подходит для ускорения на гибридных системах. Посмотрим, что будет дальше - в ПО иного назначения.

Мы уже упоминали выше, что и при проигрывании видеоданных могут использоваться возможности GPU, это касается как банального DXVA-ускорения, так и более продвинутых методов постобработки и стабилизации видеороликов. Одним из наиболее распространённых медиаплееров является VLC Media Player с открытым исходным кодом.

В последних версиях этот плеер поддерживает такие возможности новых APU от компании AMD, как стабилизация видео в реальном времени Steady Video 2.0, а также использует OpenCL при повышении качества проигрывания при помощи постобработки, вроде шумоподавления.

Стабилизация видео действительно работает неплохо, хотя пока и не без «детских болезней» - включается не на всех роликах, плохо работает в режиме работы от батарей и т.п., но это всё программные проблемы, которые исправят в ближайшем будущем. Интереснее возможность GPU-ускорения при декодировании видео и постобработке, её то мы и протестировали:

Как и ожидалось, разница снова получилась впечатляющей - ведь задача отлично подходит для переноса части вычислений на графическое ядро. В результате подключения возможностей GPU к обработке, универсальные x86-ядра нового процессора A10-4600M были заняты работой значительно меньше, чем в чисто программном режиме, разница составила до 10 раз.

Если сложной обработкой видео и изображений занимаются далеко не все пользователи, то с архиваторами в той или иной мере знакомы почти все. Мы уже писали в обзорах новой серии видеокарт AMD Radeon HD 7000 о поддержке новых GPU архиватором WinZip 16.5. WinZip - это одна из самых популярных утилит для сжатия и кодирования файлов, а также резервного копирования. И даже с учётом того, что её популярность в последние годы упала, WinZip остаётся одним из наиболее распространённых архиваторов.

Тем интереснее, что версия WinZip 16.5 поддерживает не только многопоточное сжатие файлов на многоядерных CPU, но и OpenCL-ускоренное сжатие. Для более эффективного сжатия при помощи GPU пришлось распараллелить обработку файлов - с включенным OpenCL архиватор обрабатывает сразу несколько файлов одновременно.

Пресс-релизы компании-партнёра AMD заявляют о поддержке OpenCL-ускорения на всех совместимых продуктах AMD, начиная от APU и заканчивая дискретной графикой AMD Radeon, а также об увеличении скорости сжатия до 2,5-кратной, по сравнению с WinZip 16. То же самое касается и шифрования при помощи алгоритма AES, которое требует много вычислительных ресурсов и хорошо распараллеливается, а поэтому тоже ускоряется при помощи OpenCL.

Цифра ускорения в 2,5 раза нам кажется завышенной, да и сравнение со старой версией архиватора не так интересно, поэтому мы проверили скорость сжатия на двух наборах файлов. Первым таким набором стала игра Lost Planet, состоящая из более чем 200 файлов общим объёмом в 7,5 ГБ. Для сжатия использовался ZIPX-формат, с AES-шифрованием и без него:

WinZIP Software OpenCL
Метод ZIPX 27:25 26:16
Метод ZIPX+AES128 27:16 25:09

Никакими 2,5 разами и не пахнет! Разница в скорости у нас получилась лишь 4% и 8% для сжатия в обычном режиме и с использованием AES-шифрования. Этого явно недостаточно для того, чтобы посчитать задачу подходящей для вычислений на GPU. Очень похоже, что сжатие данных в ZIP-формат просто плохо распараллеливается и при переносе на GPU ускорение весьма слабое.

Но может быть небольшой рост производительности связан с малым количеством файлов, которые плохо распараллеливаются и сжимаются? Мы проверили второй набор файлов, состоящий из исполнимых файлов и файлов данных с различными драйверами (всего более чем 7000 файлов разного размера, общий объём - 1,3 ГБ).

WinZIP Software OpenCL
Метод ZIPX 5:31 4:46

Как видите, снова ничего похожего на многократные ускорения нет, хотя некий прирост в скорости, несомненно, наблюдается, но и тут это всего лишь 16%. То есть, для более-менее заметного ускорения процесса сжатия файлов средствами WinZip 16.5 нужно, чтобы файлов было много, и ещё желательно применять AES-шифрование. Тогда и прирост скорости в пару десятков процентов вполне возможен. Но никаких 2,5 раза у нас нет даже близко.

После не самого удачного примера, снова вернёмся к обработке изображений - но на этот раз статичным изображениям и к конкуренту Adobe Photoshop, если его можно так назвать - GNU Image Manipulation Program (GIMP) версии 2.8. Это - популярнейший редактор изображений с открытым исходным кодом, который массово используется по всему миру.

В указанной версии появилась поддержка OpenCL-ускорения, предназначенная для повышения производительности рендеринга, фильтров и прочих вычислительных задач. В текущей версии уже поддерживается OpenCL-ускорение для 19 фильтров - так называемых GEGL операций. Будущее большое обновление GIMP принесёт внедрение библиотеки GEGL в основной конвейер обработки, текущее же OpenCL-ускорение работает с GEGL фильтрами, но не конвейером GIMP в целом. Так что в полноценных релизах следующих версий пользы от OpenCL должно стать ещё больше.

Лучше всего ускорение на GPU работает для четырёхканальных изображений с 8-бит на цвет - и это наиболее востребованный формат. Причём, желательно, чтобы горизонтальное и вертикальное разрешение изображений нацело делилось на 512. Чтобы получить максимальную разницу, мы протестировали обработку изображения размером 4096x2048 пикселей.

GEGL operations CPU, МПикс/с GPGPU, МПикс/с
bilateral filter 0,106 11,441
c2g 0,109 1,685
gaussian-blur 0,297 17,924
motion-blur 0,196 20,682
noise-reduction 0,344 3,983
snn-mean 0,156 6,721

Ну вот, теперь мы снова видим приличную разницу. Причём, скорость исполнения OpenCL фильтров на CPU и GPU отличается не в 2,5 и даже не в 10 раз, а до 100! Мы получили преимущество GPU над CPU от 15 до 108 раз, в зависимости от применяемого фильтра. Понятно, что обработка изображений максимально подходит для использования мощностей графического ядра, а для CPU задача может быть просто недостаточно оптимизированной, так как OpenCL-код на CPU не всегда исполняется эффективно. В любом случае, редактирующие изображения в GIMP и использует подобные фильтры, будут довольны.

Производительность в играх

Это один из наиболее интересных разделов материала. Если по производительности в офисных задачах и ускорению видеоданных интегрированные графические ядра давно догнали дискретные решения, и разница между выделенными и встроенными видеоядрами в этих задачах не столь велика, то по 3D-производительности отставание до сих пор весьма ощутимо, даже с учётом значительного роста производительности интегрированных графических ядер в последние годы.

Тем интереснее будет посмотреть, что может дать новая платформа компании AMD в этих условиях. Ведь все APU имели преимущество именно в играх, и Trinity, скорее всего, станет лучшим гибридным чипом с встроенной графикой максимальной производительности. Хотя вряд ли кто-то будет выбирать ноутбук для игр, рассматривая модели с интегрированными видеоядрами, но такие мощные интегрированные решения вполне могут дать нетребовательным пользователям возможность игры во многие из современных 3D игр. Пусть даже пользователю и придётся снизить пару настроек качества рендеринга.

Так как это один из самых важных разделов обзора, то игровых тестов в нашем материале будет много. Сначала мы рассмотрим несколько устаревших игр при сравнительно низких игровых настройках качества, чтобы сравнить результаты прототипа ноутбука, основанного на гибридном чипе A10-4600M с ранее протестированными мобильными системами, имеющих графические решения компании AMD.

И начнём мы с не слишком требовательных по современным меркам проектов. Первой игрой в обзоре будет игра известного сериала Call of Duty - ещё первая часть Modern Warfare. Более новые игры серии Call of Duty технически не сильно отличаются от MW, да и движок у них почти одинаковый. Для тестов использовалась демонстрационная запись многопользовательской битвы.

В случае старенькой игры CoD: Modern Warfare в дополнение к режиму минимального качества мы использовали в том числе максимальные настройки с использованием полноэкранного сглаживания MSAA 4x. В обоих режимах новая модель гибридного процессора от AMD показала отличный результат. В простом режиме скорость ограничена значением 90 FPS, и в таком режиме протестированный прототип ноутбука не уступил околотоповому в своё время Acer 5943G.

Ну а в режиме максимального качества с мультисэмплингом скорость уже ограничена возможностями графических ядер, и тут тестовый ноутбук на Trinity отстал от топового решения не такого уж давнего времени. А главный вывод в том, что в устаревших играх A10-4600M вполне способен обеспечить играбельную частоту кадров в тяжёлых условиях максимальных настроек даже при включенном сглаживании, в то время как на других интегрированных решениях можно будет нормально поиграть разве что при средних настройках качества.

Не все игры требовательны к мощности GPU, существует и большое количество игр недавнего прошлого, которые неплохо работают даже на слабых системах. Обычно это мультиплатформенные проекты, рассчитанные в том числе и на работу на игровых консолях, аппаратная начинка которых также выпущена довольно давно и значительно отстаёт от современного железа ПК. Одной из подобных игр является Resident Evil 5:

Это ещё одна игра, которая вышла сразу и на консолях и на ПК. Resident Evil 5 хоть и мультиплатформенная игра, но она довольно требовательна к мощности системы, в том числе и GPU. Например, маломощный GPU в составе платформы AMD Zacate не может обеспечить необходимые 25-30 FPS даже при средних настройках качества, а самая слабая дискретная видеокарта от компании AMD кое-как показывает уровень 30-40 FPS.

А вот модель Radeon HD 7660G в составе топового чипа Trinity, на котором основан рассматриваемый прототип, показала весьма неплохой сравнительный результат, но только в режиме среднего качества. Рендеринг в Resident Evil 5 при низких настройках ограничен скоростью CPU и в нём ноутбук Acer Aspire 5943G, имеющий мощный четырёхъядерный Core i7, значительно обогнал других участников сравнения.

Но при средних настройках влияние мощности CPU нивелируется, и главным ограничителем частоты кадров становится мощность GPU. И тут новая платформа Trinity отыгралась, показав более 50 средних FPS и почти достав до результата мощной дискретной видеокарты Radeon HD 5850. Эта игра при средних настройках качества на A10-4600M работает довольно быстро, поэтому будет даже выставить и максимальное качество.

Street Fighter IV - это ещё одна мультиплатформенная игра на том же движке. Она относится к жанру файтингов, который отличается от большинства других тем, что для комфортного игрового процесса требует не менее 60 кадров в секунду. Но игра старая и графически несложная, поэтому во всех тестовых настройках, выбранных нами пару лет назад для тогдашних ноутбуков, такой FPS обеспечивается.

В этом случае при минимальных настройках почти все видеокарты обеспечили приемлемую производительность, кроме Zacate, а в среднем режиме комфортной смены частоты кадров не смогла обеспечить ещё и самая слабая Radeon HD 5470M. А вот гибридная модель AMD A10-4600M снова оказалась весьма быстрой, хотя и уступила системе с Mobility Radeon HD 5850 - всё-таки это дискретная видеокарта с гораздо большим потреблением энергии, пусть и устаревшая. При сотне кадров в секунду в этой игре явно можно будет повысить настройки качества на системах, основанных на Trinity APU.

Ещё одна старая мультиплатформенная игра, но более требовательная и даже имеющая поддержку DirectX 10 - Lost Planet. В этом тесте производительности новое решение AMD снова очень хорошо отработало, уступив гораздо более мощному ноутбуку от Acer не так уж много. В Lost Planet мы сравнивали все решения только при низких настройках, так как даже в них не всегда обеспечивается высокая скорость рендеринга на ноутбуках средней мощности.

В подтесте Cave производительность ограничена скоростью CPU, и поэтому старый ноутбук с четырёхъядерным CPU выигрывает в нём гораздо больше, чем в подтесте Snow, который показывает скорость графического ядра. В последнем тесте новинка от AMD лишь на 20% медленнее старого дискретного решения, и для гибридного процессора Trinity это можно считать приличным успехом. На такой системе можно будет даже выставить настройки для более высокого качества рендеринга при сохранении приемлемого FPS.

Временно закончим с мультиплатформенными играми, и перейдём к эксклюзивным играм для ПК из наиболее распространённых жанров: RTS и FPS. Первой по списку у нас идёт старенькая уже стратегия реального времени World in Conflict:

И снова мы видим ситуацию, когда в низких настройках старое решение, имеющее четырёхъядерный процессор выигрывает у нашей новинки больше, чем при средних настройках качества рендеринга. Это объясняется точно так же, как и в предыдущих тестах - в режиме средних настроек качества системы не упираются в мощность центральных процессоров, и поэтому Radeon HD 7660G показывает неплохой результат между мобильными версиями Radeon HD 5470 и HD 5850.

World in Conflict довольно сильно процессорозависима, и лишь при средних настройках тесты показывают скорость GPU. Тесты показали, что на рассматриваемом сегодня прототипе, основанном на гибридном чипе A10-4600M, вполне будет повысить игровые настройки выше средних, чтобы добиться лучшей картинки при сохранении приемлемой частоты кадров. Тем более, что для стратегии даже реального времени хватит и 30 FPS. Посмотрим, что получится в шутерах от первого лица, которые являются наиболее требовательными к мощности GPU.

STALKER: Зов Припяти - это пример довольно «тяжёлой» для графических процессоров игры, несмотря на то, что она уже далеко не нова. Максимальные настройки в ней способны поставить на колени даже мощнейшие видеокарты настольных компьютеров, что уж говорить о мобильных. Спасает то, что графический движок игры отлично масштабируется и настраивается, а режим самого низкого качества («статическое освещение») позволяет даже интегрированным видеоядрам показывать достаточную для комфортной игры частоту кадров.

В лёгком режиме скорость рендеринга снова ограничивает центральный процессор системы, поэтому прототип на Trinity довольно серьёзно уступает ноутбуку, имеющему очень мощный процессор Intel Core i7. В среднем по тяжести настроек режиме «полного динамического освещения» скорость у всех ноутбуков заметно ниже, и Radeon HD 7660G в этом режиме отстаёт от него уже не так сильно, хотя разница всё равно велика. И в случае такой тяжёлой графически игры как «Зов Припяти», на системах с новым мобильным APU не удастся серьёзно повысить графические настройки выше средних.

Игра Far Cry 2 является мультиплатформенным проектом, но она отличается продвинутой на время своего выхода графикой, значительно улучшенной именно в ПК-версии. Как мы выяснили в прошлые разы, её с трудом тянут интегрированные графические решения Intel и даже самые слабые дискретные мобильные видеокарты - они не дают играбельного FPS даже при средних настройках качества, не говоря о высоких с применением DirectX 10.

А вот мощный гибридный APU модели A10-4600M - совсем другое дело! Прототип мобильной системы на базе этого чипа, имеющий Radeon HD 7660G, показал весьма неплохую скорость даже при высоких настройках с включением DirectX 10. Подумайте только, современная встроенная графика даст комфортный FPS в этой игре при таких настройках, обеспечив более чем 40 кадров в секунду! В таких условиях скорость самых слабых решений, включая интегрированную графику от Intel (до Ivy Bridge), не обеспечит даже 25-30 FPS.

А на ноутбуке с новым решением от компании AMD можно будет даже повысить несколько настроек качества до ещё более высоких, получив более качественную картинку и вполне достаточную скорость рендеринга. Или даже включить полноэкранное сглаживание, что совсем недавно было недоступно даже на мобильных дискретных видеокартах нижнего ценового диапазона.

К сожалению, из-за сырости платформы и драйверов для неё, весьма тяжёлая для видеокарт игра Crysis Warhead не запустилась на прототипе AMD Trinity. Поэтому мы переходим сразу к ещё одной устаревшей игре из наших тестов мобильной графики - гоночному проекту DiRT 2 от компании Codemasters. Эта игра поддерживает такие возможности DirectX 11, как тесселяция и DirectCompute, и включает неплохой тест производительности. К сожалению, ASUS K52Jr и систему на Zacate в этой игре мы не тестировали, так что их результатов на диаграмме нет.

А вот гибридный процессор AMD A10-4600M справляется с задачей очень неплохо, при средних настройках обеспечивая более чем приемлемую скорость рендеринга в 45 FPS. Хотя отставание от системы с мобильным Radeon HD 5850 довольно велико - на наш взгляд, APU больше всего не хватает пропускной способности памяти, в которую упирается скорость рендеринга в этой игре.

Впрочем, для интегрированной видеокарты результат всё равно очень хороший, и даёт возможность попробовать и высокие настройки, что мы и попробуем сделать далее при тестировании в следующей части этой игры - DiRT 3.

Рассмотрим последнюю игру из устаревшего тестового набора - ещё один мультиплатформенный проект со специальной улучшенной ПК-версией - Just Cause 2. Ноутбук ASUS с Radeon HD 5470M, а также тестовая система на базе AMD Zacate в данном сравнении снова не участвовали.

Судя по показанным цифрам FPS, Just Cause 2 является одним из наиболее тяжёлых игровых тестов для не слишком мощных мобильных видеокарт. Даже при самых низких настройках очень мощная видеокарта позапрошлого поколения даёт лишь 60 FPS, а при высоком (не максимальном!) качестве еле-еле дотягивает до минимального уровня производительности, необходимого для достижения играбельности.

Но Mobility Radeon HD 5850, входящий в состав конфигурации Acer Aspire 5943G, всё же смог показать приемлемую частоту кадров при картинке высокого качества, чего не удалось сделать нашему сегодняшнему герою - чипу A10-4600M с Radeon HD 7660G. В этой игре на системах с Trinity придётся выставлять средние настройки, так как при высоких настройках качества картинки обеспечивается лишь 25 кадров в секунду, чего не хватит для нормальной игры.

Хотя по устаревшим игровым тестам уже можно сделать выводы об уровне 3D-производительности нового решения компании AMD, но это всё же довольно старые проекты, вышедшие несколько лет назад. И наше тестирование было бы неполноценным без включения в них новейших приложений. Причём уже не в низких и средних настройках, а в более сложных. Для этого мы взяли набор из нескольких современных игр, протестировав их в режимах высокого качества, а иногда и с включением эффектов DirectX 11, полноэкранного сглаживания методом MSAA и даже эффектами PhysX (в данном случае выполняемых программно, конечно же):

Итак, давайте рассмотрим игры по очереди. Игра Mafia 2 также не заработала на ноутбуке AMD Trinity из-за некоей несовместимости, а было бы интересно посмотреть, как справится с этой игрой новый APU при условия включения физических эффектов, ведь даже при их исполнении на мобильных дискретных видеокартах NVIDIA скорость порой падает ниже комфортного минимума.

Но у нас есть ещё один проект с поддержкой аппаратных физических расчётов GPU PhysX - Batman Arkham City. При высоких настройках средняя частота кадров в тесте на Trinity достигла 45 FPS, что очень даже неплохо для мобильного чипа с интегрированной графикой, а при включении экстремальных настроек качества, включая тесселяцию и другие эффекты DirectX 11, скорость упала уже до 22 FPS, что хоть и не играбельно, но является потрясающим результатом для такого чипа (у новейшей дискретной видеокарты GeForce GT 640M было лишь немногим больше).

Включение многочисленных PhysX-эффектов в этой игре сказывается на скорости ещё сильнее, так как «физику» обрабатывает центральный процессор. И FPS в этом случае просаживается до 16, что уже заметно ниже играбельности. Но это всего лишь мобильное решение с встроенным GPU и программным PhysX, так что даже такая производительность для Trinity - это выдающееся достижение.

Переходим к игре DiRT 3, вторую часть которой мы уже рассматривали чуть выше. Третья от предшественницы мало отличается технологически, зато мы проверили высокие и «ультравысокие» настройки качества. Новый мобильный APU AMD A10-4600M, имеющий видеоядро Radeon HD 7660G, очень неплохо справился с высокими настройками, обеспечив более чем 40 FPS, а вот режим Ultra новому чипу не дался - 22 FPS нельзя считать играбельной производительностью.

Похожие результаты были показаны и в проекте F1 2011, основанном на том же игровом движке. Эта игра посвящена прошлому сезону Формулы 1 и новая модель APU от компании AMD при высоких настройках способна дать возможность поиграть сравнительно комфортно, со средним FPS выше 30. А вот в «ультра»-варианте мы снова видим лишь чуть более 20 FPS, что явно неиграбельно, но не стоит забывать, что это - интегрированная графика!

Игра Hard Reset отличается неплохой графикой, но она является не слишком требовательной к мощности GPU. И наш сегодняшний герой - прототип ноутбука на базе Trinity - показал в этой игре неплохую скорость: при средних настройках более 30 FPS, при ультравысоких - около 25 FPS, что близко к играбельности.

Вторая часть игры Lost Planet отличается ещё большей нагрузкой на GPU и использует такие возможности DirectX 11, как тесселяцию и DirectCompute. Поэтому в режиме высоких настроек, включающих тесселяцию и другие требовательные эффекты, производительности AMD A10-4600M было явно недостаточно, и скорость «просела» до 12 FPS. И даже при средних настройках скорость смены кадров не превысила 25 FPS, что говорит о том, что Lost Planet 2 является одним из тяжелейших для GPU тестов 3D-производительности.

Игра Aliens vs Predator также использует новые возможности DirectX 11, такие как тесселяцию и вычислительные шейдеры при постобработке, и она весьма тяжела для GPU, хотя и не настолько, как предыдущая. При низких настройках в игре на тестовой системе с Trinity получена частота кадров выше 35 FPS, а при высоких, с включением SSAO и тесселяции, скорость рендеринга снова находится ниже предела играбельности - лишь чуть выше 20 кадров в секунду. Впрочем, тут и дискретная GeForce GT 640M набрала лишь 30 FPS, так что для интегрированного видеоядра результат отличный.

Последней современной игрой, вошедшей в наши тесты, стал популярный проект Crysis 2. Вторая часть не слишком сильно подняла планку требовательности к мощности GPU, по сравнению с первой, да и встроенный бенчмарк хоть и использует тесселяцию и продвинутые DX11-эффекты, но даже на мобильной графике показывает довольно высокие результаты. При Very high и Extreme настройках получены 22-29 FPS - и это снова отличный результат для ноутбука с гибридным процессором.

Полученные в современных играх при «тяжёлых» настройках цифры производительности впечатляют, особенно на фоне других процессоров с интегрированной графикой и дискретных видеокарт прошлых поколений. В наших тестах гибридный AMD A10-4600M показал себя весьма неплохо - уровень его производительности заметно выше, чем в предыдущем поколении и явно окажется лучше, чем будет иметь грядущее поколение мобильных Ivy Bridge от компании Intel.

Дело даже не в сравнении цифр средней частоты кадров, а в том, что мобильный гибридный чип от компании AMD, сочетающий CPU и GPU, впервые в состоянии обеспечить играбельность в режиме высоких настроек качества в большом количестве современных игр. В то время, как интегрированная графика конкурента часто не способна обеспечить минимальную играбельность даже в режиме низких настроек, не говоря уже о средних и максимальных.

А если производительности видеоядра в составе APU всё же недостаточно, то в скором времени будут предлагаться мобильные ПК, имеющие и APU и дискретную мобильную видеокарту Radeon HD 7000, которые будут способны совместно работать над рендерингом, что даст ещё большую производительность, а также улучшит применимость ноутбуков при решении различных задач.

Воспроизведение видеоданных

Кроме высокой частоты кадров в современных играх, для ноутбуков важно, чтобы аппаратное ускорение декодирования всех форматов поддерживалось графическим видеоядром, в том числе интегрированным. Хотя даже самые простые процессоры сейчас справляются с такой работой программно, но аппаратное декодирование при помощи специализированных блоков в GPU гораздо энергоэффективнее и способно увеличить время работы в автономном режиме, что немаловажно для мобильных решений.

Наши предыдущие тесты показали, что сложностей с аппаратным ускорением декодирования видеоданных нет уже ни на каких GPU, даже интегрированные решения Intel хорошо справляются с задачей, хотя некоторые проблемы у встроенных в процессоры Intel видеоядрах всё же остались.

Но нас интересует не Intel, а новый APU от компании AMD. Давайте проверим, что у A10-4600M получается с декодированием видео на практике. Для тестов мы взяли один файл формата MPEG-2 с чересстрочным Full HD, один файл формата VC-1 высокого разрешения и набор роликов наиболее распространённого формата H.264 (MPEG-4 AVC) с разным разрешением и битрейтом.

Декодирование видео AMD Trinity
(A10-4600M
HD7660G)
Acer M3
(i5-2467M
GT640M)
Acer
5943G
(i7-720QM
HD5850)
ASUS
K52Jr
(i3-350
HD5470)
MPEG-2 1080i 11% 8% 14% 11%
VC-1 1080p 6% 38% 5% 7%
H.264 480p 5% 5% 5% 6%
H.264 720p 5% 13% 10% 10%
H.264 1080p (20 Мбит/с) 5% 5% 5% 6%
H.264 1080p (40 Мбит/с) 6% 6% 5% 7%

С MPEG2-ускорением современные GPU давно легко справляются, кроме тех случаев, когда требуется постобработка для устранения чересстрочности (deinterlacing - деинтерлейсинг). Именно такой ролик входит в наш тестовый набор, и некоторое отставание ноутбуков, имеющих графические ядра Radeon (в т.ч. и с новым APU), в случае файла MPEG2 объясняется более качественным алгоритмом устранения чересстрочности. Впрочем, на всех системах тестовый файл проигрывался отлично, включая и нашего сегодняшнего героя - прототипа системы на Trinity от AMD.

При декодировании ролика формата VC-1 у AMD A10-4600M также всё прекрасно, чего не скажешь о ноутбуке Acer, использующем встроенное в процессор Intel Core с архитектурой Sandy Bridge видеоядро, которое не умеет аппаратно декодировать видео в формате VC-1 (по крайней мере, в плеере MPC-HC). Да и вообще, новый APU прекрасно справился со всеми видеороликами. Формат H.264 в любых его проявлениях поддался A10-4600M очень легко, GPU справляется с роликами отлично, примерно с одинаковой загрузкой CPU.

При проигрывании всех роликов DXVA-ускорение работает эффективно, и сейчас практически любое интегрированное мобильное видеоядро справляется с декодированием HD-видео даже в случае самых тяжёлых видеороликов с максимальным качеством и битрейтом. Но насколько эффективно декодируются видеоданные на Trinity APU? Давайте это проверим, измерив времени работы от батареи в разных режимах.

Время автономной работы

Перед рассмотрением возможностей прототипа ноутбука от AMD, нужно вспомнить о том, что его конфигурация включает немаленький экран и оптический привод, а литиево-полимерная батарея имеет шесть ячеек ёмкостью около 56 Вт·ч - это средний уровень. Заявленное производителем максимальное время автономной работы для ноутбуков на основе Trinity составляет более чем 11 часов, но это число указано явно для режима простоя.

Поверим компании AMD на слово, ведь режим простоя при задействовании максимального профиля энергосбережения мы не проверяли, так как просто не видим в нём никакого смысла, ведь на ноутбуке нужно работать, а не просто оставлять его пожирать батарею. А если он не нужен, то пусть отправляется в режим сна.

Первым тестовым режимом у нас считается режим активного чтения (или интернет-сёрфинга) с включенным в фоновом режиме проигрывателем аудиофайлов формата MP3, а вторым - довольно востребованный режим просмотра кинофильмов в формате H.264 с включенным DXVA-ускорением. Профиль энергосбережения в этих двух режимах был «сбалансированным» - который по умолчанию и устанавливается большинством ноутбуков.

Время работы, час:мин AMD Trinity
(A10-4600M
HD7660G)
Acer M3
(i5-2467M
GT640M)
Acer
5943G
(i7-720QM
HD5850)
ASUS
K52Jr
(i3-350
HD5470)
Активная работа (2D + аудио) 7:16 7:40 2:47 2:05
Воспроизведение видео H.264 4:47 5:14 2:29 1:43

Вспомним, что у модели Acer Aspire 5943G установлена батарея значительно большей ёмкости (83 Вт·ч против 56 Вт·ч у нашего сегодняшнего героя), у Acer M3 - почти такой же ёмкости, а у ноутбука ASUS - меньшей (48 Вт·ч). Хорошо видно отличие во времени выпуска ноутбуков. Даже самый ёмкий аккумулятор не помог старой топовой модели Aspire 5943G, и в режиме чтения она отработала совсем мало времени.

Прототип ноутбука на базе чипа AMD A10-4600M показал очень неплохой результат в режиме чтения более чем 7 часов, вплотную приблизившись к очень хорошему результату игрового ультрабука от Acer, который использовал гибридный процессор Intel Core i5-2467M с гораздо меньшим показателем TDP. То есть, модели платформы Trinity из низкопотребляющих, вроде A6 и A4, покажут результат ещё лучше. Технологии снижения энергопотребления AMD оказались весьма эффективными.

При просмотре аппаратно декодированного видеоролика в формате H.264 системы не смогли проработать столь же долго, но разница между решениями примерно такая же. Хотя почти все ноутбуки позволяют просмотреть двухчасовое видео при работе от батареи (кроме ASUS со слабой батареей), но только Acer Aspire Timeline Ultra M3 и прототип на AMD A10-4600M смогли обеспечить порядка 5 часов просмотра видеоролика в таких условиях.

Посмотрим, что получится в режиме максимальной игровой нагрузки. В качестве «нагрузочного» трёхмерного приложения мы ранее использовали встроенный в игру Lost Planet тест производительности, который достаточно сильно нагружает как CPU, так и GPU, и его воспроизведение закольцовано, что отлично подходит для нашей задачи. Мы проверили не только время автономной работы в производительном режиме (Performance), но и полученную при этом скорость рендеринга:

И вот когда у игрового ультрабука Acer в работу включилось дискретное видеоядро, мы увидели ещё одно преимущество нашего сегодняшнего героя - платформы Trinity. В этом случае модель A10-4600M обеспечивает максимальную продолжительность работы при несколько меньшей производительности, по сравнению с явно более мощным решением.

А устаревшие ноутбуки служат лучшим индикатором прогресса. Aspire 5943G даже с заметно более ёмкой батареей проработал не так уж долго, а производительность в игре Lost Planet и у топовой модели нового APU оказалась вполне достаточной, а по времени автономной работы прототип от AMD и вовсе стал победителем сравнения - отличный результат для Trinity!

Хотя даже такие экономичные решения как AMD A10-4600M, не дадут поиграть на мобильном ПК в автономном режиме даже пару часов, так что требовательные 3D-игры на ноутбуках без сетевой розетки поблизости по-прежнему долго не протянут.

Выводы

С выходом Trinity компания AMD продолжила свою «гибридную» стратегию, начатую в Llano и Zacate. Хотя огромных скачков в производительности ждать не приходилось из-за отсутствия прогресса в используемом техпроцессе, CPU и GPU части в новых APU получили приличный прирост производительности и эффективности, по сравнению с прошлым поколением. Хотя по универсальным вычислениям на CPU решение AMD может отставать от современных решений конкурента (речь о будущих мобильных Ivy Bridge), зато скорость графического ядра в Trinity явно останется самой высокой в классе.

В новой серии Trinity, AMD продолжает использовать иной подход к балансу в скорости CPU и GPU, по сравнению с Intel. И даже выход 22 нм решений конкурента, имеющих новейшее видеоядро модели HD 4000, не сможет им помочь опередить соответствующие по потреблению модели Trinity. Гибридные чипы AMD продолжат выигрывать в графических задачах, хотя конкурент подобрался уже явно ближе за счёт выпуска чипов на более совершенном техпроцессе, с которыми мы ещё сравним Trinity в будущих материалах.

Необходимо особо отметить увеличение количества и качества приложений, использующих возможности графических ядер в универсальных вычислениях. Если в момент выхода Zacate и Llano мы отмечали, что таковых приложений нет совсем, то сейчас они уже появились. Причём, речь касается не только и не столько привычных приложений по обработке видеоданных, но и архиваторов, графических пакетов и др. Хотя идеал до сих пор не достигнут, и будет интересно посмотреть на дальнейшее развитие ситуации. В любом случае, отмечаем явный прогресс решений AMD по поддержке GPGPU вычислений уже в реальных приложениях - тут они также имеют явное преимущество над конкурентом. И дальнейшее расширение применения OpenCL в программном обеспечении только усилит позиции компании.

Что касается архитектурных изменений в составе блоков Trinity, то тут мы отметим, что улучшения в ядрах Piledriver явно пошли на пользу новому APU. В случае с настольными решениями линейки AMD FX конкурировать им было очень трудно, а в Piledriver эффективность вычислений явно улучшили. И пусть AMD не смогла повысить производительность Trinity настолько, насколько смогла бы это сделать, переведя чипы на более «тонкий» техпроцесс, применение модифицированных x86-совместимых вычислительных ядер совершенно точно дало им увеличение скорости.

Перевод на более совершенный техпроцесс дал бы ещё больший рост производительности, но и в таком виде Trinity - это весьма неплохо спроектированная платформа, выжимающая все соки из имеющихся 32 нм. Кроме улучшений в CPU ядрах, которые привели к росту скорости вычислений, нужно отметить и применение более эффективной графической архитектуры VLIW4, которая позволила заметно повысить скорость в 3D задачах при схожей сложности и размере кристалла, по сравнению с Llano.

И пусть Trinity не бьёт рекордов скорости универсальных вычислений на x86-ядрах, в вышедших APU её вполне достаточно для большинства применений. Гораздо важнее экономичность и время автономной работы, и очередной сильной стороной вышедших мобильных гибридных чипов Trinity является очень неплохая энергоэффективность. Продолжительность работы в автономном режиме у протестированного прототипа оказалась очень хорошей, а в 3D-игре так и вовсе выдающейся. При этом мы протестировали не самый экономичный вариант из линейки новых APU. И можно точно сказать, что по сравнению с Llano получился явный шаг вперёд, и по энергоэффективности решения AMD будут конкурентоспособными даже по сравнению с новейшими 22 нм процессорами Intel.

В общем, в сравнении двух грандов: AMD и Intel, итог остаётся прежним. Если по CPU-производительности некоторое преимущество имеет Intel, которая пользуется в том числе и тем, что имеет свои фабрики по выпуску чипов, которые быстро переходят на более новые техпроцессы, то по мощности и функциональности графических решений преимущество у AMD - их APU имеют явно лучшие возможности в игровых приложениях. Новый гибридный чип от AMD оказался в состоянии обеспечить приемлемую производительность в большом количестве современных игр при высоких настройках качества.

Да, у Intel есть партнёрство с NVIDIA, и применение дискретной графики в дополнение к интегрированной в CPU решает часть проблем. Но в плюсах AMD не только большая скорость встроенных GPU, они ещё и умеют одновременно использовать мощности интегрированной и дискретной графики нового поколения, получая ещё большую скорость - за это отвечает технология AMD Radeon Dual Graphics.

В рамках материала нам осталось рассмотреть ценовой вопрос. И тут пока что не всё понятно. Просто потому, что реальный выход решений на розничный рынок может многое изменить - ведь стоимость конечного продукта зависит от цены множества его комплектующих, а APU хоть и является одним из важнейших, но лишь одним. Похоже, Trinity лучше всего подойдёт для таких ноутбуков, каким получился прототип, выданный нам для тестов - в его корпусе с 14-дюймовым экраном заключена мощь, достаточная для большинства задач, даже игровых. Причём, речь идёт в том числе о большей части требовательных современных игр.

При этом такой ноутбук невелик по размеру, сравнительно лёгкий и имеет приличное время автономной работы. Да и цена таких решений обещает быть не слишком высокой - ниже, чем у тех же ультрабуков, к примеру. Которые хотя и компактнее, но и менее мощные. С другой стороны стоят более мощные решения, вроде протестированного нами недавно игрового ультрабука с дискретной видеокартой NVIDIA GeForce GT 640M - они быстрее, но и дороже, да и потребляют больше энергии. Да и нам обещан выпуск гибридных систем с встроенной и дискретной графикой от AMD, в которых будут применяться продвинутые средства переключения между GPU, аналогичные NVIDIA Optimus.

Чтобы сделать окончательные выводы, нам не хватает информации о розничных ценах ноутбуков на базе Trinity и конкурирующих с ними решений от Intel. Ведь с точки зрения потенциального покупателя именно цена является важнейшей характеристикой любого товара. Мы уверены, что AMD со своими партнёрами по выпуску конечных решений смогут предложить выгодные цены на мобильные ПК на базе очень хороших чипов платформы Trinity. Ноутбуки, использующие платформу AMD A10, ожидаются в продаже по ценам порядка $700, что ниже цен на ультрабуки на базе Intel Ivy Bridge, ожидаемые примерно в то же время. И на момент выхода, новые APU обеспечат отличное сочетание возможностей и характеристик за эти деньги.

Компания Advanced Micro Devices опубликовала в эти дни результаты тестирования своего мобильного ускорителя вычислений A10-4600M , рассчитанного на использование в ноутбуках mainstream-класса. Естественно, кроме этого были оглашены и его технические характеристики. Итак, предстоящая новинка базируется на 32-нанометровой микроархитектуре Trinity, в нее входит четыре ядра x86-64, распределённых по двум модулям Piledriver. Разработчик включил сюда 4 МБ общего кэша (2 х 2 МБ), тактовая частота CPU составляет 2,30 ГГц, в режиме TurboCore она разгоняется до отметки в 3,0 ГГц. A10-4600M получил интегрированную графику Radeon HD 7660G с 384 потоковыми процессорами VLIW4, номинальная частота iGPU равна 685 МГц. Чип наделен встроенной шиной PCI-Express 2.0 и контроллером оперативной памяти с поддержкой двухканальных планок DDR3-1600 МГц.

Что касается результатов тестов, то AMD решила представить графики производительности видеоподсистемы в гибридном режиме, где на помощь встроенному в APU видеоядру Radeon HD 7660G был брошен мобильный адаптер Radeon HD 7670M. Итоги такого состязания приведены на нижеследующем слайде, однако стоит учитывать, что исследования проводились специалистами AMD и всех условий тестирования мы не знаем.

Более интересным нашим читателям будет график, представленный специалистами сайта NordicHardware, в котором производительность IGP в режиме Dual Graphics сравнивается с аналогичными мобильными видеокартами.

Лучшие статьи по теме