Особенности архитектуры и возможности процессора
По заявлениям представителей Loongson, система команд ее архитектуры LoongArch состоит из приблизительно 2000 уникальных инструкций. Им удалось добиться повышенной энергоэффективности процессора за счет отказа от устаревших процессорных команд.
В дополнение к базовому набору команд также были реализованы инструкции двоичного преобразования (LBT), векторной обработки (LSX), расширенной векторной обработки (LASX) и виртуализации (LVZ).
Процессор 3А5000 и первый лэптоп на его основе
Для производства процессора 3A5000 используется 12-нанометровый техпроцесс. Loongson не уточняет, на фабриках какой компании он выпускается, и каковы нынешние объемы его производства. Все другие процессоры Loongson производит компания STMicroelectronics, у самой Loongson собственных заводов нет.
Каждый такой чип содержит в себе по четыре вычислительных ядра, частота которых достигает 2,5 ГГц. В каждом ядре есть квартет арифметически-логических устройств (ALU) и два блока для обработки векторных операций по 256 бит каждый.
CrystalMark 2004
Тесты производительности ALU и FPU в тестовом пакете CrystalMark 2004 адекватно отражают производительность соответствующих блоков CPU и состоят из нескольких подтестов. На диаграмме представлены лишь итоговые результаты.
А в этом синтетическом бенчмарке CPU AMD Athlon X2 7750 BE работая с RAM в режиме UNGANGED показывает немногим более высокие результаты чем в режиме GANGED, хотя и разница в пределах погрешности. CPU AMD Athlon 64 X2 5200 находится в явных аутсайдерах, особенно сильно его отставание заметно в тесте FPU, то есть работу по улучшению этого блока ядра в новом семействе CPU инженеры AMD провели немалую. Разгон тестового CPU AMD Athlon X2 7750 BE еще больше закрепляет его преимущество над своим противником, работающим на штатной тактовой частоте.
Характеристики AMD Athlon II X4 750K
Модель |
AMD Athlon II x4 750K |
Маркировка |
AD750KW0A44HJ |
Процессорный разъем |
Socket FM2 |
Тактовая частота (номинальная), МГц |
3400 |
Максимальная тактовая частота с Turbo Core 3.0, МГц |
4000 |
Множитель |
34 (разблокирован) |
Частота шины, МГц |
100 |
Объем кэш-памяти первого уровня L1, КБ |
2х64 (память инструкций) 4х16 (память данных) |
Объем кэш-памяти второго уровня L2, КБ |
2×2048 |
Объем кэш-памяти третьего уровня L3, КБ |
— |
Ядро |
Trinity |
Количество ядер/потоков |
4/4 |
Поддержка инструкций |
MMX, SSE, SSE2, SSE3, SSE4, SSE4A, x86-64, AMD-V, AES, AVX, XOP |
Напряжение питания, В |
0,825 — 1,475 |
Рассеиваемая мощность, Вт |
100 |
Критическая температура, °C |
71,3 |
Техпроцесс |
32 нм |
Поддержка технологий |
Turbo Core 3.0 PowerNow! |
Встроенный контролер памяти |
|
Максимальный объем памяти, ГБ |
64 |
Типы памяти |
DDR3 (частота до 1866 МГц) |
Число каналов памяти |
2 |
По спецификации легко заметить, что, скорее всего, основой данного CPU стал гибридный процессор APU A10-5700. В пользу данных умозаключений говорят и частотные характеристики решения и естественно использованное в нем количество модулей/ядер Piledriver. Единственный параметр, который выбивается из общего с APU A10-5700 ряда, это TDP (в данной модели соответствует 100 Вт). Подобное увеличение теплопакета связано в первую очередь с наличием разблокированного множителя, который в значительной степени упрощает процедуру разгона ЦП, однако следствием этого выступает повышенное тепловыделение.
Вспомогательная утилита подтверждает, что процессор изготовлен согласно норм 32-нм техпроцесса. В основе данной модели лежит архитектура Trinity. Средняя рабочая частота с включенной технологией Turbo Cre 3.0 составляет 3,7 ГГц, при этом напряжение на ядре составляет 1,392 В, что несколько выше чем у APU A10-5700. Наиболее интересным параметром является значение TDP, которое отражается утилитой. В данном случае оно соответствует 65 Вт. Конечно же, значение не корректно, однако это в очередной раз наталкивает на размышления о максимальном родстве с энергоэффективным топовым APU.
Минимальное значение частоты процессора, которое соответствует состоянию простоя, идентично у всех решений, относящихся к архитектуре Trinity, и равно 1,4 ГГц, при этом напряжение на ядре опускается до 0,928 В.
Кэш-память AMD Athlon II x4 750K распределяется следующим образом. Кэш-память первого уровня L1: по 16 КБ на каждое из 4-х ядер выделяется для данных с 4-мя каналами ассоциативности, при этом для инструкций имеется 64 КБ на каждый двухъядерный модуль (напомним, в четырехъядерном процессоре их 2) с 2-мя каналами ассоциативности. Кэш-память второго уровня L2: по 2 МБ на каждый двухъядерный модуль процессора с 16-ю каналами ассоциативности. Кэш-память третьего уровня L3 отсутствует. Вы видите, что в данном случае никаких принципиальных изменений в сравнении с четырехядерными гибридными процессорами нового поколения нет.
Контроллер памяти DDR3 работает в двухканальном режиме и способен поддерживать оперативную память вплоть до DDR3-1866 МГц.
SiSoftware Sandra Lite 2009 SP2
В качестве очередного синтетического бенчмарка нами использовалась утилита SiSoftware Sandra Lite 2009 SP2. Как говорилось ранее, результаты бенчмарков в этой утилите не всегда отражают реальную производительность CPU, тем не менее она дает общее представление о производительности центральных процессоров.
Из диаграммы видно, что борьбы между тестовыми центральными процессорами как таковой нет. Как и следовало ожидать, CPU AMD Athlon 64 X2 5200 существенно отстает от своего преемника, особенно сильно это проявляется в мультимедийном тесте CPU — преимущество практически полуторакратное.
Если говорить непосредственно о CPU AMD Athlon X2 7750 BE то, как и в прошлом синтетическом бенчмарке разница в производительности при его работе в разных режимах с оперативной памятью минимальна, правда в этот раз этот CPU в режиме UNGANGED не во всех тестах выигрывает самого же себя в режиме GANGED. В разгоне, результат CPU AMD Athlon X2 7750 BE закономерно лучше, чем при работе на штатной частоте, причем прирост достаточно велик.
Резюмируя результаты синтетического бенчмарка SiSoftware Sandra Lite 2009 SP2, следует отметить, что новый Athlon от AMD в этом синтетическом тесте выглядит достойно.
Тестирование процессора
Материнские платы (AMD) | |
Материнские платы (AMD) | ASUS SABERTOOTH 990FX (AMD 990FX, sAM3+, DDR3, ATX) |
Материнские платы (Intel) | |
Кулеры | |
Оперативная память | 2х 4ГБ DDR3-2400 TwinMOS TwiSTER 9DHCGN4B-HAWP |
Видеокарта | AMD Radeon HD 7970 3 ГБ GDDR5 |
Жесткий диск | Seagate Barracuda 7200.12 ST3500418AS, 500 ГБ, SATA-300, NCQ |
Блок питания | Seasonic X-660, 660 Вт, Active PFC, 80 PLUS Gold, 120 мм fan |
Как вы видите, применение технологии Turbo Core 3.0 позволяет только выиграть в производительности системы, поэтому ее использование обязательно при работе в номинальном режиме. Ведь «насильственное» ее отключение однозначно приведет к умышленному замедлению системы на примерно 4%.
Результаты замера уровня производительности в большинстве своем подтверждают тот факт, что за основу AMD Athlon II x4 750K был выбран гибридный процессор AMD APU A10-5700, у которого по причинам известным исключительно производителю, отключено графическое ядро. Незначительное расхождение тестов в большую или меньшую сторону в конечном итоге сводятся к тому, что средний уровень производительности AMD Athlon II x4 750K и AMD APU A10-5700 идентичен. Единственное отличие данных моделей состоит в отсутствии встроенного графического ядра, однако данная потеря запросто может компенсироваться дискретным адаптером начальной или средней производительности, ведь различие в стоимости порядка 50$ способно покрыть его приобретение.
Наиболее интересные показатели можно заметить при сравнении с AMD FX-4100
Обращаем ваше внимание, что на данный момент в нашей базе имеются результаты замера производительности, полученные путем отключения двух модулей AMD FX-8150 и отключением технологии Turbo Core. Отключить ее пришлось в связи с неправильной отработкой данного режима даже при условии указания частот промежуточных состояний
Так или иначе, но мы примем эти значения за основу и видим, что тестируемый AMD Athlon II x4 750K отличается по производительности не более чем на 0,5% от AMD FX-4100. Даже если предположить, что TC 2.0 обеспечит дополнительные 3-4% производительности AMD FX-4100, то по стоимости более выгодное положение занимает именно AMD Athlon II x4 750K. Так что можно с уверенностью утверждать о наличии положительных тенденций в развитии архитектур компании AMD. Стоит также отметить, что благодаря наличию кэш-памяти третьего уровня AMD FX-4100 вырывается в лидеры в задачах связанных с архивированием и кодированием видео.
При сравнении тестируемого ЦП с Intel Core i3-3220 заметно отставание на уровне 13-14% по среднему уровню производительности для решения компании AMD. Единственное, что говорит в его пользу, так это стоимость, которая на 40$ ниже, при наличии поддержки дополнительных инструкций, в частности AES, что обеспечивает более высокий уровень производительности в задачах связанных с шифрованием данных, хоть и выглядит данное преимущество несколько сомнительным.
Достаточно важным параметром для тестируемого ЦП является энергопотребление. В данном случае AMD Athlon II x4 750K выглядит вполне пристойно. Незначительное уменьшение энергопотребления по отношению к AMD APU A10-5700 связано с отключением графического ядра. Относительно небольшой уровень энергопотребления позволит собрать экономичную систему, однако конечная стоимость системы на базе данного CPU может не самым лучшим образом сказаться на популярности.
Новые процессоры и партнеры AMD
AMD официально представила процессоры для центров обработки данных Epyc Rome, выполненные на базе микроархитектуре Zen 2. Это первые в мире серверные процессоры с архитектурой x86, производящиеся по семинанометровому технологическому процессу. Применение новой архитектуры позволило добиться 15-процентного прироста числа инструкций, повышенной производительности и энергоэффективности.
Новые процессоры должны составить конкуренцию чипам Intel Xeon Scalable второго поколения (семейство Cascade Lake). В AMD утверждают, что Epyc Rome обеспечивают вдвое большую производительность в сравнении с Xeon, при этом они могут быть от двух до четырех раз дешевле решений Intel при сравнимой вычислительной мощи.
AMD также заявила, о том, что ей удалось привлечь Google и Twitter в качестве клиентов. Сервис микроблогов планирует внедрить новинки в собственных дата-центрах в этом году. Поисковый гигант уже использует процессоры во внутренних ЦОДах. Кроме американских интернет-гигантов в числе партнеров AMD, уже анонсировавших свои планы по использованию решений чипмейкера, значатся Microsoft, HPE, Cray, Lenovo и Dell.
AMD представила второе поколение процессоров Epyc
К 2020 г. AMD намерена довести свою долю на рынке серверных процессоров до 10%. Сейчас она не превышает 3%.
Модельный ряд APU Trinity
На момент старта новой платформы, линейка чипов Trinity включает шесть моделей. По два четырехъядерных процессора A10 и A8, а также по одному A6 и A4. Как видим, в названии серий APU никак не отражено количество блоков x86. В то же время, прослеживается зависимость принадлежности чипа к той или иной линейке, которая определяется по количеству вычислительных ядер интегрированной графики: A10 – 384, A8 – 256, A6 – 192, A4 – 128. Это еще один наглядный пример того, как производитель хочет подчеркнуть значимость графической составляющей.
Что касается стоимости новых APU, то чипы Trinity играют фактически в том же ценовом сегменте, что и предшественники – $50–130. При этом интересна система ценообразования. Оба A10 оценены производителем в $122. Одну рекомендованную стоимость имеют как модель с разблокированным множителем, так и чип с меньшей тактовой частотой и заблокированным КУ, который тем не менее обладает TDP на уровне 65 Вт, вместо 100 Вт у флагмана. Точно такая же ситуация и с APU линейки A8 – обе модели предлагаются по одной цене в $101. Для кого-то ценности имеет более высокая производительность, кому-то предпочтительнее более экономичные варианты. И для тех и для других подходящие процессоры обойдутся в одну цену.
Как и в случае с процессорами Llano, а также устройствами от конкурента, модели с индексом «K» имеют разблокированный множитель. Любопытно, что теперь самая доступная модель с такой возможностью стоит всего $67, тогда как цена на APU предыдущего поколения со свободным множителем стартовала с $80. Впрочем, A6-3670К – четырехъядерная модель, тогда как A6-5400К оснащена лишь одним модулем с парой зависимых модулей.
Для Socket FM2 также будут доступны процессоры с отключенным графическим ядром, которые пополнят линейку чипов Athlon. Учитывая общую концепцию APU, очевидно, что для таких моделей не будут производиться отдельные кристаллы (хотя, если учесть площадь, занимаемую GPU, это имело бы смысл), для таких процессоров в первую очередь будут использоваться чипы, с определенными проблемами в графической части, а если таковых окажется меньше, чем того потребует рынок, то в ход пойдут и полноценные кристаллы с деактивированным GPU.