Menu
Jest wolny
rejestracja
główny  /  Oprogramowanie układowe/ Porównanie procesorów bajkał i intel. "Baikals" podszedł do testów nowoczesnych procesorów Intela

Porównanie procesorów bajkał i intel. „Baikals” podszedł do testów nowoczesnych procesorów Intela

17.08.2017, czw, 19:24, czasu moskiewskiego , Tekst: Denis Voeikov

Twórcy krajowych procesorów "Bajkał" przeprowadzili szeroko zakrojone testy na wielu metrykach. Jeden z nich korzystnie pokazuje porównywalność cech rosyjskiego produktu z produktami liderów światowego rynku.

Pozytywny test dla "Bajkału"

Krajowe procesory „Bajkał” w wielu parametrach wykazały wskaźniki wydajności porównywalne z produktami uznanych światowych liderów w branży.

W sierpniu 2017 r. firma deweloperska Baikal Electronics przeprowadziła pełny test wydajności swojego procesora Baikal-T1 działającego z częstotliwością zegara 1,2 GHz. Do oceny jego właściwości zastosowano technikę, która daje możliwość usystematyzowania uzyskanych wyników niezależnie od rodzaju mikroarchitektury procesora i zastosowanej platformy programowej.

Pomiary przeprowadzono w sześciu aplikacjach określających wydajność zarówno modułów obliczeniowych procesora, jak i przepustowość zaimplementowanych bloków funkcjonalnych: CoreMark, Dhrystone, Whetstone, Stream, IPERF, SPEC CPU2006.

Warunki testowe (źródło: "Baikal Electronics")

„Benchmarking pokazał, że rzeczywiste wskaźniki wydajności procesora Baikal-T1 przewyższają szacowaną wydajność dla rdzeni procesora MIPS klasy P, a te z kolei wyglądają bardzo korzystnie w porównaniu z architekturą x86” – skomentował przedstawiciel Baikal Electronics. na CNews. Andriej Małafiejew... Z jego wyjaśnień można było wywnioskować, że mówimy o stosunku wydajności do zużycia energii i wydajności do powierzchni matrycy.

Wyniki testu Baikal-T1 (źródło: "Baikal Electronics")

Jednocześnie Malafiejew zdaje sobie sprawę, że Baikal-T1 jest architektonicznie skoncentrowany przede wszystkim na rynkach rozwiązań komunikacyjnych i systemów wbudowanych. Jednak z punktu widzenia Malafiejewa dobra wydajność pozwala na wykorzystanie rozważanego Bajkał-T1 jako uniwersalnego procesora „w rozległym ekosystemie, który rozwija się od ponad ćwierć wieku i ma znaczny potencjał na istniejących i wschodzących rynkach. "

Porównanie warunkowe

Jak można było wywnioskować z komunikacji z Malafiejewem, jego firma największą wagę przywiązuje do testu na benchmarku CoreMark (o jego porównaniu z innymi metrykami przeczytajcie poniżej), który jest bardziej skoncentrowany na procesorach dla systemów wbudowanych, choć jest również wykorzystywany dla innych procesorów do bardzo różnych celów.

W tej chwili Baikal-T1 nie jest oficjalnie prezentowany na stronie kuratorów testu - Baikal Electronics nie przekazała mu jeszcze wyników uzyskanych dla swoich testów.

Selektywne warunkowe porównanie znanych procesorów z Baikal-T1 w teście CoreMark

procesor Kategoria Data opracowania Liczba rdzeni TDP (projektowa moc cieplna), W Częstotliwość zegara, MHz Wynik, CoreMark Znak rdzenia / MHz Znak rdzenia / MHz / rdzeń
ARM Cortex-A9 (Quad Exynos4) mobilny 2007 4 2,5 1 400 22 243 3,97
Intel I7-7700 Pulpit 2017 4 65 3 600 1,51
Intel Core i3-330M Do laptopów 2010 2 35 2 130 19 547 4,59
AMD Phenom™ II X4 Pulpit 2009 4 125 2 600 19 143 1,84
Zintegrowany procesor NXP P2041 QorIQ Komunikacja 2014 4 3,7 1 500 18 620 3,1
ARM Cortex-A15 mobilny 2010 8 4 1 700 15 908 1,17
AMD Athlon X2 5000+ Pulpit 2006 2 65 2 600 15 500 2,98
Intel Core i5-2400 Pulpit 2011 4 65 3 100 15 478 1,25
Samsung Exynos 4412 mobilny 2012 4 4 1 400 15 399 2,74
Procesor Intel Xeon E5-2690 v2 serwer 2013 10 130 3 000 14 767 0,49
Intel i7-2640M Do laptopów 2011 2 35 2 800 14 513 2,59
AMD Opteron 254 (2P) * serwer 2005 2x1 * 2x 68 * 2 800 13 713 2,45
AMD AMD Athlon X2 7750 Pulpit 2009 2 95 2 700 13 482 2,49
Calxeda EnergyCore ECX-1000 serwer 2012 4 5,26 1 400 13 446 2,4
Bajkał-T1 Pulpit 2016 2 5 1 200 13 142 10,95 5,47
Intel Atom N2800 Komputer stacjonarny, do laptopów 2011 2 6,5 1 860 12 286 3,3
Intel Core i5-2410M Do laptopów 2011 2 35 2 300 11 737 2,55
AMD E350 Komputer stacjonarny, do laptopów 2011 2 18 1 600 10 987 1,71
Intel Xeon X5450 serwer 2010 4 120 3 000 10 907 0,91
Intel Atom E3827 Komputer stacjonarny, do laptopów 2013 2 8 1 743 10 820 3,1
VIA Technologies Nano x2 l4350 Komputer stacjonarny, do laptopów 2011 2 18 1 600 9 104 2,84
Intel Atom D525 Komputer stacjonarny, do laptopów 2010 2 13 1 800 9 076 2,52
Procesor Intel (R) Atom (TM) 330 Komputer stacjonarny, do laptopów 2008 2 8 1 600 9 049 2,83
dwurdzeniowy procesor Intel Pentium E5300 Pulpit 2008 2 65 2 600 8 885 1,71

Twórcy krajowych procesorów „Bajkał” przeprowadzili szeroko zakrojone testy na wielu metrykach. Jeden z nich korzystnie pokazuje porównywalność cech rosyjskiego produktu z produktami liderów światowego rynku.

Pozytywny test dla "Bajkału"

Krajowe procesory „Bajkał” w wielu parametrach wykazały wskaźniki wydajności porównywalne z produktami uznanych światowych liderów w branży.

W sierpniu 2017 r. firma deweloperska Baikal Electronics przeprowadziła pełny test wydajności swojego procesora Baikal-T1 działającego z częstotliwością zegara 1,2 GHz. Do oceny jego właściwości zastosowano technikę, która daje możliwość usystematyzowania uzyskanych wyników niezależnie od rodzaju mikroarchitektury procesora i zastosowanej platformy programowej.

Pomiary przeprowadzono w sześciu aplikacjach określających wydajność zarówno modułów obliczeniowych procesora, jak i przepustowość zaimplementowanych bloków funkcjonalnych: CoreMark, Dhrystone, Whetstone, Stream, IPERF, SPEC CPU2006.

Warunki testowe (źródło: "Baikal Electronics")

„Benchmarking pokazał, że rzeczywiste wskaźniki wydajności procesora Bajkał-T1 przewyższają szacowaną wydajność dla rdzeni procesora MIPS klasy P, a te z kolei wyglądają bardzo korzystnie w porównaniu z architekturą x86” – Andrey Malafiev, przedstawiciel Bajkału Elektronika, skomentował CNews. Z jego wyjaśnień można było wywnioskować, że mówimy o stosunku wydajności do zużycia energii i wydajności do powierzchni matrycy.


Wyniki testu Baikal-T1 (źródło: "Baikal Electronics")

Jednocześnie Malafiejew zdaje sobie sprawę, że Baikal-T1 jest architektonicznie skoncentrowany przede wszystkim na rynkach rozwiązań komunikacyjnych i systemów wbudowanych. Jednak z punktu widzenia Malafiejewa dobra wydajność pozwala na wykorzystanie rozważanego Bajkał-T1 jako uniwersalnego procesora „w rozległym ekosystemie, który rozwija się od ponad ćwierć wieku i ma znaczny potencjał na istniejących i wschodzących rynkach. "

Porównanie warunkowe

Jak można było wywnioskować z komunikacji z Malafiejewem, jego firma największą wagę przywiązuje do testu na benchmarku CoreMark (o jego porównaniu z innymi metrykami przeczytajcie poniżej), który jest bardziej skoncentrowany na procesorach dla systemów wbudowanych, choć jest również wykorzystywany dla innych procesorów do bardzo różnych celów.

Na stronie kuratorów testu Bajkał-T1 oficjalnie włączony ten moment nie reprezentowany - "Baikal Electronics" nie przedstawił jeszcze wyników uzyskanych dla swoich testów.

Selektywne warunkowe porównanie znanych procesorów z Baikal-T1 w teście CoreMark

Źródło: CNews Analytics

* testowany serwer oparty na dwóch procesorach jednordzeniowych

W związku z tym, dla jasności, CNews Analytics wybrał wyniki testów kilku obecnych procesorów znanych marek i wskazał wśród nich domniemane miejsce Bajkału-T1 (patrz tabela).

Na czym testowano Bajkał

Według Malafiejewa, sześć przedstawionych benchmarków to zestawy testów syntetycznych z pewną mieszanką instrukcji typowych dla określonych zastosowań.

„Tradycyjne testy porównawcze Dhrystone i Whetstone są przeznaczone do pomiaru wydajności jednostka centralna na obliczeniach odpowiednio w arytmetyce liczb całkowitych i zmiennoprzecinkowych - mówi Malafiejew. - Są uniwersalne i można je pisać w różnych językach programowania (na przykład pierwsze wersje Dhrystone i Whetstone, wydane w latach 1960-1970 ubiegłego wieku, zostały napisane w Fortranie i Algolu 60). Jednocześnie mogą korzystać z różnych bibliotek i będąc składane przez różne kompilatory, dawać znacząco różne kody wykonawcze, co w pewnym stopniu dewaluuje uzyskane za ich pomocą szacunki wydajności. W pewnym stopniu te niedociągnięcia są przezwyciężane przez standaryzację niektórych skompilowanych kodów (czyli wersji dla DOS, OS / 2, Windows).”

Według eksperta benchmark CoreMark koncentruje się na systemach wbudowanych i obejmuje takie funkcje, jak przetwarzanie list, manipulacja macierzą, implementacja maszyny stanów i obliczanie CRC (Check Redundancy Code). Jest napisany w standardowym języku C iw przeciwieństwie do innych benchmarków nie zawiera żadnych dodatkowych bibliotek i daje ten sam wynik.

„Te zalety sprawiają, że ten benchmark jest coraz bardziej popularny i stopniowo zastępuje konkurentów”, mówi Malafiejew. „Jednak Dhrystone i Whetstone są nadal szeroko stosowane”.

Test Stream, jak twierdzi ekspert, jest prostym syntetycznym testem porównawczym, który mierzy solidną przepustowość pamięci (w MB/s) i odpowiednią szybkość obliczeń dla prostych rdzeni wektorowych.

IPERF to narzędzie typu open source kod źródłowy które można wykorzystać do testowania wydajności sieci. SPEC CPU2006 zawiera dwa zestawy benchmarków: CINT2006 do mierzenia i porównywania intensywności obliczeniowej wydajności liczb całkowitych oraz CFP2006 do mierzenia i porównywania intensywności obliczeniowej z liczbą zmiennoprzecinkową.

Bajkał-T1, nakład wydania, koszt opracowania, konsumenci

Baikal-T1 to procesor z architekturą MIPS (Microprocessor without Interlocked Pipeline Stages), stworzony zgodnie z koncepcją RISC, czyli dla procesorów ze zredukowanym zestawem instrukcji.

Prace nad procesorem zakończono pod koniec 2014 roku, a w grudniu Baikal Electronics przekazał do fabryki TSMC tzw. kod produktu RTL w celu jego wydania. W maju 2015 roku firma ogłosiła wydanie próbek inżynieryjnych.

Następnie poinformowano, że rozwój został zrealizowany przy wsparciu Ministerstwa Przemysłu i Handlu przy zaangażowaniu środków z samego departamentu i federalnego programu docelowego „Rozwój bazy podzespołów elektronicznych i elektroniki radiowej na lata 2008-2015”, jako oraz inwestycje firm „T-nano” i „T-platforma” (struktura macierzysta „Baikal Electronics”). W tym czasie nie ujawnił dokładnej kwoty inwestycji w projekt w "Bajkale".

Następnie próbki były ręcznie testowane, a Bajkał był przekonany o ich wydajności. Następnie, pod koniec lata 2015 roku, firma wystąpiła do rady ekspertów Funduszu Rozwoju Przemysłu (IDF) przy Ministerstwie Przemysłu i Handlu o pożyczkę tematyczną na kontynuację projektu – uruchomienie produkcji seryjnej.

W październiku 2015 r. zatwierdzono kredyt preferencyjny. Na poziomie inwestycji własnych firmy 288 mln rubli. wielkość tej pożyczki wyniosła 500 mln RUB. Za te pieniądze „Bajkał” w grudniu 2015 r. złożył zamówienie w TSMC. We wrześniu 2016 roku ujrzała światło dzienne tzw. partia instalacyjna około 10 tys. procesorów.

W marcu 2017 roku firma Baikal Electronics ogłosiła rychłe wydanie 100-tysięcznej serii przemysłowej.

Głównymi konsumentami Baikal-T1 są producenci sprzętu telekomunikacyjnego (routery, telefony IP, urządzenia do przechowywania danych itp.), komputerów, sprzętu do systemów wbudowanych (automatyka przemysłowa, terminale, systemy motoryzacyjne itp.). Wielkość zużycia procesorów na tych rynkach, według FRP, rośnie w granicach 7-15% rocznie.

31.05.2018, czw, 16:03, czasu moskiewskiego , Tekst: Denis Voeikov

„Bajkały” zaczynają być sprzedawane w sprzedaży detalicznej w postaci nagiej – bez „zestawów body” w postaci tablic ewaluacyjnych. Dzięki temu cena procesorów dla kupującego jest obniżona dokładnie 10 razy.

Czysta sprzedaż „Bajkału”

Jak dowiedział się CNews, rosyjskie procesory „Bajkał” po raz pierwszy trafiają do sprzedaży detalicznej jako niezależne jednostki towarowe, a nie jako część płyt ewaluacyjnych (komputery jednopłytkowe). O pojawieniu się ich produktów w asortymencie sklepów części elektroniczne„Chip and Dip” od 1 czerwca 2018 r. „w ilościach potrzebnych do prototypowania i produkcji próbek testowych elektroniki” podała redakcja krajowej firmy „Baikal Electronics” – twórcy „Baikals”.

Do wdrożenia przygotowano pierwszy i jak dotąd jedyny seryjnie produkowany chip organizacji Baikal-T1 (nowa oficjalna nazwa - BE-T1000).

Cena detaliczna jednego procesora wyniesie 3990 rubli. W porównaniu z płytami na „Bajkale” z rodziny BFK 3.1 (skrót: funkcjonalna jednostka sterująca), które w połowie kwietnia 2018 r. kosztowały 39,9 tys. rubli, goły chip kosztuje dokładnie 10 razy taniej.

Możliwe stało się kupowanie "Bajkału" w sprzedaży detalicznej bez obciążenia w postaci desek

Deweloperzy dodają, że polityka cenowa dla partii hurtowych jest ustalana indywidualnie. W takim przypadku produkty są dostarczane przez Baikal Electronics bezpośrednio do klienta.

Pozycjonowanie jakościowo-cenowe

Na pytanie CNews, w jaki sposób, pod względem połączenia proponowanej ceny i istniejących cech procesora, firma ocenia nową ofertę w Rynek rosyjski, Baikal Electronics ograniczyło się do formalnej odpowiedzi. „Złożyliśmy bardzo korzystną ofertę cenową – w paradygmacie wydajność/funkcjonalność/zużycie energii nasz produkt ma dobrą pozycję” – mówili rozmówcy CNews.

Specyfikacje procesorów

Baikal-T1 to tzw. system-on-a-chip o wymiarach 25 x 25 mm i deklarowanym poborze mocy poniżej 5 watów. Posiada dwa superskalarne rdzenie P5600 MIPS 32 r5 o częstotliwości roboczej 1,2 GHz. Posiada 1 MB pamięci podręcznej L2 i kontroler pamięci DDR3-1600.

Układ posiada jeden port Ethernet 10Gb, dwa porty Ethernet 1Gb, kontroler PCIe Gen.3 x4, dwa porty SATA 3.0, USB 2.0.

Żetony są produkowane zgodnie z proces technologiczny przy 28 nanometrach - bezpośrednio w fabryce tajwańskiej firmy TSMC. Ta ostatnia okoliczność przesądza o tym, że Bajkał-T1 jest klasyfikowany przez Ministerstwo Przemysłu i Handlu jako rosyjski układ scalony drugiego stopnia, a nie pierwszego, jak to było w przypadku tamtejszej fabryki.

Zakończenie formowania ekosystemu procesorów

Przypomnijmy, że na początku stycznia 2018 r. – jeszcze przed uruchomieniem Bajkału jako części tablic testowych – okazało się, że dzięki staraniom Bajkał Electronics i Wydziału Matematyki Obliczeniowej i Cybernetyki (CMC) Moskiewskiego Uniwersytetu Łomonosowa na Na bazie centrum danych VMK znajduje się laboratorium elektroniki domowej, do którego dostęp jest otwarty dla wszystkich zainteresowanych.

Wykorzystując zasoby nowej struktury, zwanej Laboratorium Elektroniki „Bajkał” (LEB), możliwa jest ocena wydajności procesora centralnego i opartych na nim rozwiązań oraz debugowanie aplikacji i oprogramowania systemowego.

„Teraz naszym głównym celem jest obniżenie kosztów wprowadzania projektów dla deweloperów”, mówi Konstantin Shcherbakov, dyrektor działu marketingu i sprzedaży w Baikal Electronics. „Zrobimy to, poprawiając jakość dokumentacji, tworząc pakiet oprogramowania, aktualizując i rozpowszechniając uwagi do aplikacji i projekty referencyjne”.

Szczerbakow jest pewien, że w tej chwili, z punktu widzenia ekosystemu, jego firma jest gotowa wesprzeć projektowanie produktów końcowych przez klientów z Bajkału: od laboratorium opartego na VMK Moskiewskiego Uniwersytetu Państwowego, po prosty zakup procesor i płytka debugowania do tworzenia prototypów urządzeń.

Bajkał-T1, nakład wydania, koszt opracowania, konsumenci

Baikal-T1 to procesor z architekturą MIPS (Microprocessor without Interlocked Pipeline Stages), stworzony zgodnie z koncepcją RISC, czyli dla procesorów ze zredukowanym zestawem instrukcji.

Prace nad procesorem zakończono pod koniec 2014 roku, a w grudniu firma Baikal Electronics przekazała fabryce TSMC tzw. kod produktu GDS w celu jego wydania. W maju 2015 roku firma ogłosiła wydanie próbek inżynieryjnych.

Następnie poinformowano, że rozwój został zrealizowany przy wsparciu Ministerstwa Przemysłu i Handlu przy zaangażowaniu środków z samego departamentu i federalnego programu docelowego „Rozwój bazy podzespołów elektronicznych i elektroniki radiowej na lata 2008-2015”, jako oraz inwestycje firm „T-nano” i „T-platforma” (struktura macierzysta „Baikal Electronics”). W tym czasie nie ujawnił dokładnej kwoty inwestycji w projekt w "Bajkale".

Następnie próbki były ręcznie testowane, a Bajkał był przekonany o ich wydajności. Następnie, pod koniec lata 2015 roku, firma wystąpiła do rady ekspertów Funduszu Rozwoju Przemysłu (IDF) przy Ministerstwie Przemysłu i Handlu o pożyczkę tematyczną na kontynuację projektu – uruchomienie produkcji seryjnej.

W październiku 2015 r. zatwierdzono kredyt preferencyjny na przygotowanie komercyjnej wersji procesora. Na poziomie inwestycji własnych firmy 288 mln rubli. wielkość tej pożyczki wyniosła 500 mln RUB. Za te pieniądze „Bajkał” w grudniu 2015 r. złożył zamówienie w TSMC. We wrześniu 2016 roku ujrzała światło dzienne tzw. partia instalacyjna około 10 tys. procesorów.

W marcu 2017 roku firma Baikal Electronics ogłosiła rychłe wydanie 100-tysięcznej serii przemysłowej. Następnie firma zamówiła kolejne wydania, ale nie jest jeszcze gotowa do ujawnienia informacji o ich tomach.

Głównymi konsumentami Baikal-T1 są producenci sprzętu telekomunikacyjnego (routery, telefony IP, urządzenia do przechowywania danych itp.), komputerów, sprzętu do systemów wbudowanych (automatyka przemysłowa, terminale, systemy samochodowe itp.). Według Baikal Electronics, wielkość zużycia procesorów na tych rynkach rośnie w granicach 7-15% rocznie.

Oni istnieją! Pojawiła się pierwsza publicznie dostępna wersja płyty ewaluacyjnej lub, jak nazywają to sami twórcy, kompleks programowo-sprzętowy BFK 3.1 dla programistów z SoC krajowego opracowania „Baikal-T1” oparty na architekturze MIPS P5600 Warrior. nasz test.

Przede wszystkim warto podkreślić, że BFK 3.1 jest kompleksem programowo-sprzętowym (ale z przyzwyczajenia nazwiemy to po prostu tablicą) dla programistów, a nie bazą do budowania finalnych produktów. Nikt przy zdrowych zmysłach nie użyłby go, z grubsza mówiąc, do zbudowania systemu. Po pierwsze okaże się, że będzie to nieracjonalnie drogie. Po drugie, ten pomysł jest raczej bez znaczenia. Nie, płyta jest potrzebna do programowania i debugowania oprogramowanie, cóż, aby ocenić wydajność samego procesora i jego kompatybilność z innym sprzętem. Błędem jest również porównywanie go z mikrokomputerami jednopłytowymi, takimi jak Raspberry Pi czy Cubieboard, choć formalnie jest im blisko.

Podobne narzędzia programistyczne są oferowane przez innych producentów procesorów. W zależności od rodzaju i wyposażenia mogą kosztować od setek lub dwóch do tysięcy i tysięcy dolarów. Ważne, że jest to pierwsza płyta z procesorem Baikal-T1, która nie jest już dostępna dla wąskiego kręgu osób i organizacji, jak to było wcześniej, ale prawie dla wszystkich. Tak, dużo kosztuje - 40 tysięcy rubli. Drogie, ale firma nadal nie może zaoferować niższej ceny ze względu na stosunkowo niewielki wolumen produkcji. Dodatkowo klienci po zarejestrowaniu produktu będą mieli dostęp do zamkniętej biblioteki dokumentacji inżynierskiej. Otrzymają również schematyczny projekt płyty w formacie Altium Designer, co znacznie przyspieszy i uprości proces tworzenia własnych rozwiązań programowo-sprzętowych w oparciu o płyty BFK 3.1 i procesory Baikal-T1.

Tablica "Bajkał" BFK 3.1

Sama płytka wyposażona jest w procesor z podstawową wiązką. Prawie wszystkie interfejsy procesora są doprowadzone do płyty. Brakuje tylko portu 10GbE. Sama płytka mierzy 229×191 mm (FlexATX). Posiada dwa porty SATA-3 (wersja kontrolera 3.1), jedno złącze SO-DIMM dla modułu pamięci DDR3-1600, dwa porty Gigabit Ethernet RJ-45, jeden Złącze USB 2.0 Typ A, dwa porty USB Mini-B (potrzebne do debugowania), jeden PCI-E 3.0 x4. Jest 40-pinowa listwa pinowa GPIO (główny kontroler jest 32-bitowy).

Do zasilania potrzebujesz dowolnego zasilacza ATX 2.0 o mocy 200 watów lub większej. Wartość ta jest wyraźnie podana z marginesem, nawet biorąc pod uwagę zużycie urządzeń PCI-E i SATA. Płytka posiada osobne przyciski do włączania/wyłączania zasilania oraz resetowania zasilania. Proces uruchomienia systemu jest niezwykle prosty: zainstaluj moduł pamięci, podłącz zasilacz, podłącz komputer do górnego portu mini-USB, uruchom ulubiony emulator terminala z obsługą portów COM (może być potrzebny sterownik do sam most). Cóż, to wszystko, naciśnij przycisk ON i wybierz żądany element w menu bootloadera.

Płytka posiada dwa moduły pamięci NOR o pojemności 16 i 32 MB. Pierwsza jest bootowalna, zawiera aktualne oprogramowanie. Tutaj wszystko jest standardowe: U-Boot + jądro Linux + minimalny obraz z BusyBox. Możliwe jest również uruchomienie przez sieć z serwera NFS lub TFTP. To wystarcza w przypadku systemów wbudowanych. W tym przypadku finalnym produktem jest stosunkowo kompaktowa płyta z już wlutowaną pamięcią RAM i ROM pożądanego objętość i wstępnie przygotowane i zoptymalizowane pod kątem określonego zakresu zadań środowiska oprogramowania. Na przykład możesz spojrzeć na te same routery domowe.

Drugą opcją pracy z płytą jest uruchomienie pełnoprawnego systemu operacyjnego. Wykorzystamy go do testów. Deweloperzy oferują nieco zmodyfikowaną wersję Debiana 9 z jądrem z SDK. Należy pamiętać, że sami nie odbudowują całego oprogramowania. Wykorzystywane są gotowe repozytoria mipsel-branch Debiana, więc nie ma optymalizacji dla tego konkretnego procesora. Istnieją jednak również zestawy Astra Linux Special Edition dla urządzeń Tavolga Terminal 2BT1, w których zainstalowany jest ten sam procesor Baikal-T1. Ale niestety żaden z nich otwarty dostęp nie publikuje. Oczekuje się również wsparcia Alt Linux i Buildroot oraz istnieje możliwość uruchomienia OpenWRT / LEDE.

Aby uruchomić Debiana, musisz pobrać obrazy jądra, oprogramowania układowego i ramdysku z SDK. Sam SDK zawiera również also narzędzia pomocnicze do kompilacji krzyżowej, skrypty do budowania obrazu ROM i przygotowana maszyna wirtualna dla QEMU, gdzie możesz wstępnie debugować swoje programy. Pracę z Debianem 9 na BFK 3.1 nie można jak dotąd nazwać idealnie płynną: po instalacji trzeba zagłębić się w ustawienia i zainstalować część oprogramowania, ale nie ma z tym żadnych szczególnych problemów. Szkoda tylko, że nie ma jeszcze pełnej dokumentacji płyty: będziesz musiał dowiedzieć się czegoś empirycznie lub zapytać bezpośrednio programistów.

Do testów do płyty podłączono starożytny, jak na dzisiejsze standardy, dysk Kingston SSDNow V dla systemu operacyjnego oraz moduł pamięci 4 GB DDR3L-1600 wyprodukowany przez firmę Samsung. To jednak wystarczy, aby zapoznać się z możliwościami procesora. Jest jeszcze jeden niuans - ze względu na specyfikę kontrolera nie widać całej pamięci znajdującej się w module SO-DIMM. Inne ważny punkt dotyczy podstawowego montażu programów testowych z kodów źródłowych: wszystko to zostało zrobione bezpośrednio na BFK 3.1. Klucze kompilatora są wskazane w razie potrzeby.

Muszę powiedzieć, że proces montażu nie zawsze jest bezbolesny. Gdzieś musiałem zagłębić się w parametry optymalizacji, aby osiągnąć jak najlepszy wynik. Coś udało się zmontować, ale podczas egzekucji upadło lub zachowywało się nieprawidłowo. Momentami panowało ogólne wrażenie, że twórcy nawet nie wiedzieli o istnieniu platform innych niż x86. I dotyczy to nie tylko oprogramowania. W szczególności nowoczesne procesory graficzne najprawdopodobniej nie będą działać w PCI-E, ponieważ według twórców prawie wszystkie z nich wymagają UEFI / BIOS x86. Mogą również wystąpić problemy z urządzeniami, które wewnętrznie wykorzystują, na przykład most PCI ↔ PCI-E.

Charakterystyka procesora „Baikal-T1”

Najpierw krótka uwaga o samym procesorze. Baikal-T1 ma dwa 32-bitowe rdzenie oparte na architekturze Warrior P5600 (MIPS32 Release 5) z obsługą wirtualizacji sprzętowej. Każdy rdzeń otrzymał 64 KB pamięci podręcznej L1 danych i instrukcji. Oba rdzenie mają jedną współdzieloną pamięć podręczną L2 o pojemności 1 MB.

Ponadto każdy rdzeń ma swój własny FPU z obsługą 128-bitowej karty SIMD. Rdzenie, L2 i FPU pracują na tej samej częstotliwości: 1,2 GHz. Procesor jest w stanie wykonać do czterech operacji na liczbach całkowitych, do dwóch operacji na liczbach zmiennoprzecinkowych podwójnej precyzji lub czterech operacji o pojedynczej precyzji na cykl. Oznacza to, że teoretyczna szczytowa wydajność wynosi 4,8 Gflops FP64 (2 rdzenie 1,2 GHz × 2 FP64) lub 9,6 Gflops FP32. Jednak w praktyce, aby uwolnić potencjał (jak lubią to mawiać w komentarzach) wymagana jest zarówno ręczna optymalizacja kodu, jak i kompilator, który „wie” o funkcjach FPU/SIMD.

W rzeczywistości, na przykład, niezoptymalizowana wersja Linpacka skompilowana przez GCC o otwartym kodzie źródłowym daje wyniki o rząd wielkości mniejsze niż oczekiwano. Ogólnie rzecz biorąc, sytuacja jest całkiem normalna w przypadku nowych lub specyficznych (jak Elbrus) architektur. Należy to wziąć pod uwagę podczas oceny poniższych wyników. Kolejny ważny punkt dotyczy rewelacyjnych podatności Meltdown i Spectre. Jednostki obliczeniowe w MIPS32r5 są superskalarne i mogą wykonywać instrukcje poza kolejnością, ale wyraźnie nie wspomina się o głębokich spekulacjach. Twórcy jądra ogłosili ostrzeżenie o możliwej obecności Spectre (ale nie Meltdown) w czystych jądrach P5600 / P6600. Według twórców, w przypadku Bajkał-T1 oficjalny kod sprawdzający obecność luki nie działa, ale jest za wcześnie, aby mówić z absolutną pewnością o jej braku. W planach jest zorganizowanie osobnego hackathonu w celu sprawdzenia bezpieczeństwa procesora.

Pozostałe podstawowe komponenty komunikują się za pośrednictwem magistrali AXI. Wszystkie szybkie interfejsy obsługują DMA. Sam jednokanałowy kontroler pamięci obsługuje DDR3-1600 z ECC. Maksymalna pamięć RAM obsługiwana przez procesor to 8 GB. Jest jeszcze jeden niuans - kontroler pamięci ma 32-bitową i 8-bitową magistralę danych ECC i obsługuje pracę z układami pamięci o szerokości od 8 do 32 bitów. Nie ma problemów z gotowymi produktami z już wlutowanymi odpowiednimi modułami, ale płyta główna dla zwykłych modułów SO-DIMM „widzi” tylko połowę deklarowanego rozmiaru, ponieważ zwykle „wyglądają” na zewnątrz z interfejsem 64-bitowym. Otóż ​​szybkość pracy będzie oczywiście niższa – do 6,4 GB/s.

Z ciekawych bloków znajdujących się w CPU można wyróżnić autorski koprocesor, który umożliwia np. przyspieszenie szyfrowania według standardów GOST (ale nie tylko) oraz 10-gigabitowy kontroler. Ten ostatni, jak wspomniano powyżej, wymaga osobnej antresoli z portem SFP. Ma to na celu obniżenie ostatecznej ceny BFK 3.1 i nie każdy potrzebuje tego portu do rozwoju. Pozostałe jednostki są licencjonowane przez MIPS, Imagination Technologies i Synopsys. Tutaj można podziwiać wewnętrzną strukturę chipa.

Antresola z 10 GbE SFP dla BFK pierwszej generacji. Obecnie nie ma takiej płyty dla BFK 3.1.

Procesor wymaga do zasilania napięcia 0,95 V, a deklarowany pobór mocy nie przekracza 5 watów. Podczas testów procesor rozgrzewał się do 60 stopni Celsjusza. Aktywne chłodzenie nie jest do tego wymagane, jednak w zamkniętej obudowie grzejnik nie będzie zbędny. Częstotliwość rdzenia jest dynamicznie dostosowywana w zakresie od 200 do 1500 MHz, ale wymaga to wsparcia ze strony systemu operacyjnego, więc na razie, w obecnej wersji Debiana, częstotliwość można ustawić przy starcie systemu. W każdym razie podczas pracy przy niskim obciążeniu jeden rdzeń może zostać automatycznie całkowicie wyłączony. „Baikal-T1” jest produkowany w fabrykach TSMC przy użyciu technologii procesowej 28 nm. Sam w sobie kosztuje 65 USD. Należy również pamiętać, że note ten model został pierwotnie opracowany nie tylko i nie tyle dla klientów rządowych. Ona, zgodnie z pomysłami i nadziejami twórców, powinna również trafić do zwykłych konsumentów komercyjnych, którzy tworzą produkty dla sektora cywilnego.

Test CoreMark

Przejdźmy bezpośrednio do testów. Po pierwsze, CoreMark to wyspecjalizowany test porównawczy, który służy do oceny wydajności procesorów i układów SoC w systemach wbudowanych. Właściwie to wraz z ogłoszeniem nowego rekordu w CoreMark Imagination Technologies rozpocząłem opowieść o zaletach rdzenia MIPS P5600 Warrior. To prawda, mówiliśmy o pojedynczym rdzeniu, który zresztą w tamtym czasie istniał tylko w formie symulacji na FPGA i pracował na częstotliwości 20 MHz. Wtedy mówiliśmy o rekordowej wartości CoreMark na megaherc na rdzeń: 5,61, ale w rzeczywistości należy liczyć na wartość około 5. Twórcy zwrócili nawet uwagę na większą wydajność P5600 w porównaniu z desktopowymi procesorami Intela. Formalnie „Baikal-T1” jest liderem pod względem megaherców i megaherców / rdzenia. W praktyce, aby osiągnąć wydajność w wartościach bezwzględnych, producenci nie stronią od rozbudowanych metod, zwiększających częstotliwości i liczbę rdzeni.

Niestety, baza danych CoreMark nie jest skompilowana zbyt starannie, więc musieliśmy ręcznie wybrać testy dla układów dwurdzeniowych, które miałyby częstotliwości zbliżone do „Baikal-T1” i wyraźnie wskazywały, że test używa dwóch wątków. Dla porównania dodano jedną czterordzeniową próbkę i nie jest to przypadek. Ogólnie wyniki można uszeregować według kilku kryteriów jednocześnie. Jednak od razu pojawia się wiele niuansów. Po pierwsze, zarówno rozwiązania ARM, jak i MIPS są licencjonowane na rzecz stron trzecich, więc implementacja tego samego projektu może się znacznie różnić. Po drugie, wiele zależy od optymalizacji samego kodu, jego asemblacji oraz środowiska wykonawczego.

W naszym podstawowym teście użyto GCC 6.3 z następującymi opcjami: -O3 -DMULTITHREAD = 2 -DUSE_PTHREAD -funroll-all-loops -fgcse-sm -fgcse-las -finline-limit = 1000 -mhard-float -mtune = p5600 . W testach samych deweloperów wykorzystano komercyjne środowisko Sourcery CodeBench. W dalszej części tabeli przyjmuje się następujące oznaczenia: „z. test "dla wyników zamieszczonych na stronie dewelopera; "Precomp" - do uruchamiania binariów testowych wysłanych przez twórców procesora; „B/opt.” - własne zestawy z kodów źródłowych za pomocą otwarte fundusze i wskazanie kluczy; "Optować." - kompilacja krzyżowa przy użyciu SDK i narzędzi komercyjnych zgodnie z „przepisami” od deweloperów. Dzięki ręcznej optymalizacji można osiągnąć lepszą wydajność, co bardzo wyraźnie widać w tabeli z wynikami. Nie stoimy jednak przed zadaniem iterowania po klawiszach i zagłębiania się w kod. Ale twórcy oprogramowania dla "Baikal-T1" z pewnością będą musieli to robić regularnie.

Klasyczne testy porównawcze

Z tego samego dokumentu możesz pobrać wyniki klasycznych testów porównawczych „starej szkoły”. Test strumienia do oceny pasmo pamięć została zbudowana dla jednego wątku z następującymi kluczami: -mtune = p5600 -O2 -funroll-all-loops. Wynik to około połowa teoretycznej prędkości pamięci RAM.

Wszystkie powyższe informacje o CoreMarku dotyczą Dhrystone2 (obliczenia liczb całkowitych), który został skompilowany w bazie danych z minimalną liczbą kluczy: -O3 -funroll-all-loops -mtune = p5600. Niestety, jak w powyższych przykładach, baza pomiarowa nie lśni czystością i dokładnością. Dla porównania wzięliśmy wyniki dla obliczeń 32-bitowych z wyraźnym wskazaniem obecności optymalizacji. Niestety nie są one określone. konkretne modele lub przynajmniej generację procesorów. Dodatkowo sprawę komplikuje obecność TurboBoost lub podobnych technik krótkotrwałego (a ten test jest tylko krótkotrwałym) wzrostem częstotliwości bazowej procesora, co zamazuje ogólny obraz. Ponownie test powtarza sytuację z CoreMark - pod względem megaherców wydajność P5600 nie jest zła.

Ale inne nowoczesne procesory zwiększają go, zwiększając częstotliwość i obsługując instrukcje 64-bitowe oraz liczbę rdzeni w tym samym czasie. W Whetstone wszystko jest takie samo, tylko różnica między zwiększaniem wątków i używaniem instrukcji wektorowych jest jeszcze bardziej uderzająca. O tak, żeby to wszystko złożyć, musiałem nieco poprawić kod, usuwając nieistotne wywołania w assemblerze x86 i sprawdzając obecność rozszerzeń x86, które są potrzebne tylko do identyfikacji procesora.

Do szybkie sprawdzenie działanie gigabita karty sieciowe użyto narzędzia iperf 3.1.3, które wykazało, że w przypadku połączeń jednokierunkowych prędkość pokrywa się z zalecanym 940 Mbit / s, ale w dupleksie prędkość była niestety na poziomie 1,2 Gbit / s. Twórcy tłumaczą to tym, że aby uzyskać pełną wydajność, konieczne jest niewielkie dostrojenie na poziomie oprogramowania.

Pakiet testowy Phoronix

Ale ten pomysł już ma posmak szaleństwa, ponieważ PTS jako całość nie jest przeznaczony do tego typu systemów. Montaż odbywa się bezpośrednio na testowanej maszynie, więc w przypadku Baikal-T1 jest to po prostu boleśnie długi, jak wykonanie większości testów. Właściwie zestaw wyklucza testy, których albo nie dało się skompilować, albo przez długi czas działałyby nieprzyzwoicie nawet na „dorosłych” komputerach. Pierwszy problem teoretycznie można rozwiązać ręcznie, dostosowując parametry kompilacji. Ale powtórzmy, po pierwsze nie było takiego zadania, a po drugie nie możemy zapominać, że wyniki testu raczej nie osiągną maksymalnych możliwych wartości.

Wszystkie wyniki testów są dostępne pod tym linkiem. Ściśle rzecz biorąc, wszystkie przeprowadzone testy są najprawdopodobniej rezerwą na przyszłość, aby później można było zobaczyć, o ile lepsze (lub nie) stały się (lub nie) wyniki po pracy nad systemem budowania i/lub optymalizacjami, ale w tej chwili nie ma z czym to wszystko porównywać. Z ciekawostek możemy przytoczyć tylko kilka benchmarków, które zbiegły się w konfiguracji z chińskimi procesorami Loongson Godson 3A3000 (4 rdzenie @ 1,5 Hz, pamięć podręczna L2 1 MB, pamięć podręczna L3 8 MB, 28 nm, 30 W). Oba procesory są podobne pod tym względem, że mają nową architekturę i problemy z optymalizacją dla niej kodu. Jak na razie Chińczycy wyprzedzają w wartościach bezwzględnych spory margines, ale jeśli chodzi o rdzenie, MHz i zużycie, wszystko jest trochę mniej jednoznaczne.

Wniosek

Cieszy fakt, że krajowi deweloperzy byli w stanie zaimplementować niewielki zespół iw rozsądnym czasie w sprzętowym SoC na nowoczesnej architekturze o dobrych parametrach i możliwościach. Ponadto nie jest ściśle skoncentrowany na zamówieniach rządowych i nie kosztuje wygórowanych pieniędzy. To naprawdę fajne, bez względu na to, co ktoś mówi. Ale sukces (lub porażkę) tak naprawdę można ocenić dopiero po roku lub dwóch – wszystko zależy od tego, kto iw jakich ilościach będzie wykorzystywał SoC w swoich produktach. Tylko kilka z nich jest obecnie publicznie relacjonowanych. O terminalu Tavolga wspomniano już na samym początku, choć to tylko przykład urządzenia dla służb rządowych, a także DEPO Neos Twin. Komputery przemysłowe reprezentowane są przez modele Fastwell CPC516 i CPC313 oraz moduł SF-BT1. Podobny do nich duchem jest system CNC „Resource-30” oraz moduł do pracy z elementami mikromechanicznymi układów optycznych i laserowych z CIF MSU. Ponadto zapowiedziano routery NSG-3000 i niektóre punkty dostępowe RAITEK, o których wspomina na stronie producenta. Wszystko to są typowe przykłady obszarów zastosowania „Bajkału-T1”. Chciałbym również zobaczyć rozwiązania NAS/SAN, IoT i SDR.

Firma Baikal Electronics przetestowała procesory Baikal-T1 w celu określenia wskaźników wydajności. Cnews porównał wydajność rosyjskiego układu z procesorami Intel i AMD. Okazało się, że cechy Baikal-T1 są na poziomie zagranicznych chipów wydanych 5-10 lat temu.

Baikal-T1 o częstotliwości 1,2 GHz zbudowany jest w oparciu o architekturę MIPS z wykorzystaniem technologii procesowej 28 nm. Zawiera kontroler pamięci DDR3-1600 i 1 MB pamięci podręcznej L2, obsługuje jeden port Ethernet 10 Gb, dwa porty Ethernet 1 Gb i SATA 3.0, kontroler PCIe Gen.3 x4 i USB 2.0.

Baikal-T1 został przetestowany w popularnych benchmarkach: CoreMark, Dhrystone, Whetstone, Stream, IPERF, SPEC CPU2006. Testy przeprowadzono w następujących warunkach:

Przedstawiciel „Baikal Electronics” Andrey Malafiev zauważył, że rzeczywiste wskaźniki wydajności „przewyższają szacowane parametry rdzeni procesora MIPS klasy P, a te z kolei wyglądają bardzo korzystnie w porównaniu z architekturą x86”. Przede wszystkim mówimy o stosunku wydajności do zużycia energii i powierzchni matrycy.

Specjaliści Cnews przetestowali Baikal-T1 w benchmarku CoreMark i porównali wyniki z procesorami Intel i AMD. Wyniki okazały się wyższe niż oczekiwano, ale oczywiście Bajkał-T1 nie bije rekordów:

Przypomnijmy, że Baikal-T1 był rozwijany do 2014 roku. W grudniu 2014 r. kod produktu RTL został przeniesiony do fabryki TSMC, a w maju 2015 r. otrzymano pierwsze próbki inżynierskie. Następnie firma Baikal Electronics przetestowała chipy i otrzymała pożyczkę z Ministerstwa Przemysłu i Handlu na 500 milionów rubli. Dodając do nich 288 środków własnych, firma złożyła zamówienie w TSMC i we wrześniu 2016 r. otrzymała partię instalacyjną 10 tys. procesorów. Oczekuje się, że wkrótce zostanie wydana 100-tysięczna partia przemysłowa chipów.