# чтиво | Игривый Ягуар снутри Xbox One и PS4: архитектура

    На микропроцессоре AMD Ягуар базируются две новые игровые консоли. Microsoft Xbox One, в посетителях у авторов которой не так давно побывали наши читатели. И, само собой разумеется, Sony PlayStation 4 (PS4). Что выполняет конкретно этот микропроцессор настолько симпатичным для игровой промышленности? Может быть, ответ на этот вопросец вы отыщите в его технических индивидуальностях. Продолжаем глядеть на игры со стороны «железа». И сейчас познакомимся ближе с архитектурой микропроцессора, задействованного в игровых приставках последнего поколения.

    Две архитектуры эффективнее одной


    В наши деньки технология микропроцессорной архитектуры упирается в ограничение, накладываемое энергопотреблением. Микропроцессору следует верно позиционироваться для внедрения в конкретных приборах. Предпосылкой тамошнему показатель TDP. Цифра TDP охарактеризовывает способность системы остывания отводить тепло. Она обязана быть свыше очень вероятного тепловыделения чипа, однако очень объемной припас понижает эффективность архитектуры.

    К примеру, архитектура Intel Core (Sandy/Ivy Bridge) может отлично ишачить, потребляя энергию в спектре от 13 перед началом 130 ватт. Выходит, что ее можно использовать в приборах, потребляющих все больше либо все меньше энергии. Однако куда наиболее отлично создать архитектуру, чье тепловыделение (и, соответственно, энергопотребление) в основном соответствует показателю TDP. Другими словами, предпочтительно, дабы все характеристики микропроцессора соответствовали друг дружке. Это же прибыльнее и с технической, и с экономической стороны.

    И AMD, и Intel следуют этому «правилу порядка величин». Потому любой из ведущих чипмейкеров мира размещает двумя разнообразными микропроцессорными архитектурами. Intel дает Atom для систем с низкорослым энергопотреблением и Core для высокопроизводительных компов. В 2010 году AMD предположила Bobcat, экономично относящуюся к энергетическим ресурсам, и Bulldozer для систем с высочайшей производительностью.

    И Bobcat, и Bulldozer раз в год обновляются. В 2011 году возник Bobcat, нашедший применение в однокристалльных системах (SoC) Ontario и Zacate в рамках платформы Brazos. В прошлом году AMD анонсировала Brazos 2.0. Внутри нее употребляется немного освеженные, однако максимально закадычные к позапрошлогодним SoC на основе Bobcat. А уж не так давно были представлены APU Kabini и Temash, базирующиеся на первом изрядном обновлении Bobcat: ядре Ягуар.

    Ягуар и Bobcat: схожести и разницы


    На уровне ядра микропроцессор Ягуар похож на собственного предшественника Bobcat. Эта архитектура все эдак же подразумевает одновременный пуск двух команд либо инструкций для выполнения (dual-issue). Причем она характеризуется внеочередным исполнением команд (out-of-order): это же значит, что аннотации исполняются и не по очередно, а уж по мере готовности к исполнению. Словом, в базе архитектуры покоится базисная мысль, которую AMD предположила в 2010 году.

    Всё этот же кеш первого уровня (L1); входной и выходной исполнительные блоки находятся, как только и до этого. Отметим, что архитектура ARM в Cortex A9 дозволяет сразу запускать для выполнения три аннотации (three-issue). В Cortex A15 использовано и внеочередное выполнение команд. Ведущий ресурса AnandTech узнаваемый технический обозреватель Ананд Лал Шимпи (Anand Lal Shimpi) считал, что AMD предложит миру нечто схожее.

    AMD миниатюризировала производственный процесс собственных чипов перед началом 28-нанометрового. Это же очень увлекательно, однако главный акцент компания проделала на увеличение производительности Ягуар в сопоставлении с предшественником при сохранении прежнего TDP. Что побудило AMD заняться понижением тепловыделения собственных чипов?

    Дело в фолиант, что архитектура Bobcat существовала нацелена на дешевые и компактные компы, а именно, нетбуки и неттопы. Jaguar’у же предстоит — в тотальном согласовании с веянием времени — обрести свое пространство в еще больше малогабаритных приборах: планшетах. AMD пока что и не собирается производить SoC для телефонов, однако базар планшетов на основе Windows 8 (а уж возможно, Android?) очень привлекателен для предприятия. Так как к этакого рода приборам и не предъявляется требование сопоставимости с сотовыми паутинами (и не в последнюю очередь поэтому, что стоимость них сравнимо ниже), AMD не сложно может предложить кандидатуру архитектуре Intel Atom.

    При большинстве сортов рабочей перегрузки современные микропроцессоры все равно делают наименее одной аннотации за один цикл (такт). Вероятнее всего, конкретно по данной причине в AMD и не заметили смысла вводить в архитектуру вероятность одновременного пуска трех инструкций (three-issue). Ведь это же потребовало бы повысить энергопотребление, а уж этакий подход и не оправдан для микропроцессора, нацеленного на мобильные прибора.

    За исключением тамошнего, Jaguar’ы могли бы предстать так сильными, что закончила бы чувствоваться разница меж ними и семейством Bulldozer. Как отмечалось сначала повествования, «усреднять» архитектуру нерентабельно ни с инженерной, ни с экономической точки зрения. Куда наиболее симпатичной смотрится фотомодель, в рамках которой чипмейкер дает раздельно архитектуру для могучих компов и раздельно для малогабаритных механизмов. В первом случае главное внимание уделяется производительности, во втором — энергопотреблению и теплопотере, вещам тесновато взаимосвязанным.

    Переход к одновременной загрузке трех инструкций, само собой разумеется, повысит производительность, однако и не дозволит микропроцессорам AMD занять свое пространство в планшетах. Потому, считает Ананд Лал Шимпи, увелечение мощи отложено на будущее. На фоне «трехинструкционных» ARM, и Ягуар, и Intel Silvermont смотрятся несколько старомодными. Однако при сопоставлении следует воспринимать во внимание то, что AMD и Intel изо любых сил стараются понизить энергопотребление собственных микропроцессоров. Что все-таки касается ARM, то в рамках данной архитектуры главный акцент производится на увеличение производительности.

    Ягуар владеет буфером циклов 4 х 32 б. Ежели найден цикл, заместо извлечения раз за разом расходуемых в цикле инструкций из кеша первого уровня, они извлекаются из сего маленького буфера. И не следует анализировать его в качестве трассового кеша (trace cache) либо кеша микроопераций (micro-op cache). Отношения обстоят намного прозаичнее. Привилегией заданного буфера является только то, что кеш инструкций и не нагружается всякий раз при воззвании к инструкциям, входящим в цикл. Это же средство понизить энергопотребление микропроцессора, а уж и не повысить его производительность, как только может появиться на первый взор.

    До того как выйти на базар, работа микропроцессора неоднократно моделируется. В процессе моделирования присутствуют слабенькие пространства микропроцессора. Даже, когда микропроцессор уже сконструирован, некие из их всё равно остаются. И устраняются они уже в последующих поколениях чипов.

    Можно, само собой разумеется, годами, а уж то и десятилетиями доводить микропроцессор перед началом безупречного состояния. Однако производителю приходится мыслить не совсем только об фолиант, дабы предложить базару самый оптимальный из потенциальных микропроцессоров. Он всегда учитывает ограничения, посреди которых основные участия играются издержки и график, в который следует уложиться. Если б производитель размещал неограниченным бюджет, он мог бы ликвидировать все узенькие пространства собственных разработок. Однако на это же потребовалась бы вечность. В действительности приходится идти на компромиссы.

    Одним из примеров этакого компромисса может послужить тамошний факт, что AMD тормознула на одновременном запуске двух (а уж и не трех) инструкций. Компания а также отказалась от кеша микроопераций в пользу буфера циклов, являющегося наиболее примитивным решением. Вероятнее всего, инженеры предприятия сочли, что очень не мало энергии теряется напрасно по время исполнения циклов, и добавление специального буфера для этих задач является хорошим решением исходя из убеждений сбережения энергии, издержек и трудности продажи.

    AMD а также усовершенствовала прибор опережающей (упреждающей) подборки команд кеша инструкций (команд). Это же воззвание к конструкции Bobcat и старание определить ее индивидуальностям применение в рамках новейшей архитектуры Ягуар. На этот раз AMD и не пришлось производить важно иную архитектуру. Ей же существовало довольно только сделать на основе Bobcat этакую архитектуру, которая будет наводить справку с теми самыми же задачками предпочтительнее, чем ее предшественница. Буфер инструкций меж кешем инструкций и декодерами в Ягуар предстал все больше. Однако это же половинчатое решение. В Bulldozer стадии подборки и декодирования вообщем отделены.

    В Ягуар реализована 40-битная физическая адресация и поддержка новеньких инструкций: SSE4.1/4.2, AES, CLMUL, MOVBE, AVX, F16C, BMI1. Хлипким пространством Bobcat существовало то, что ее декодер накладывал ограничение на наивысшую частоту. В Ягуар добавлена добавочная стадия декодирования, позволяющая распродать предусмотренную AMD частоту в рамках 28-нанометровой технологии.

    По материалам AnandTech.com