CCoW: optimització de la còpia sobre escriptura tenint en compte la localitat espacial de les càrregues de treball, part 6

Apr 03, 2024

La millor mida de la regió i el llindar varien segons les característiques de la càrrega de treball. Per avaluar la influència de la càrrega de treball, mesurem el rendiment de CCoW en les càrregues de treball amb diverses localitats. Concretament, hem canviat el paràmetre de la Zipfdistribution, que determina el grau de localitat.

Hi ha una estreta relació entre la memòria humana i la càrrega de treball. Quan necessitem processar grans quantitats d'informació o completar tasques complexes, el nostre cervell ha de mantenir-se molt atent per garantir que tota la informació necessària es processa i emmagatzema correctament. Les neurones del cervell es connecten i es comuniquen constantment, la qual cosa afecta molt la nostra manera de pensar i recordar.

Tot i que processar grans quantitats d'informació i completar tasques complexes pot desafiar la nostra memòria i les nostres capacitats cognitives, la investigació demostra que amb un entrenament i una pràctica adequats, podem millorar significativament la nostra memòria i productivitat. Per exemple, a través d'experiments, els científics han descobert que mitjançant l'entrenament i la pràctica de la memòria extensos, les persones poden millorar significativament la seva memòria i l'eficiència del treball.

Des d'aquesta perspectiva, podem concloure que la pràctica i la formació contínua són molt importants per a aquells que volen millorar la seva memòria i l'eficiència laboral. A més, manteniu una actitud positiva, ja que l'estrès pot dificultar la memòria i la productivitat.

En resum, hi ha una forta correlació entre la càrrega de treball i la memòria. Sempre que ens mantinguem concentrats, entrenem i practiquem regularment i mantenim una actitud positiva, podem millorar significativament la nostra memòria i l'eficiència laboral. Cistanche deserticola també pot regular l'equilibri dels neurotransmissors, com ara l'augment dels nivells d'acetilcolina i factors de creixement, que són importants per a la memòria i l'aprenentatge. A més, Cistanche deserticola també pot millorar el flux sanguini i promoure el lliurament d'oxigen, cosa que pot garantir que el cervell rebi suficients nutrients i energia, millorant així la vitalitat i la resistència del cervell.

supplements to improve memory

Fes clic a Coneix maneres de millorar la teva memòria

Els accessos es distribueixen uniformement quan és {{0}}, i com més gran sigui el valor de , més alt serà el nivell de localitat que mostra la càrrega de treball. Quan és 1,0, aproximadament el 80% de les operacions impliquen el 20% de les dades.

Aquest grau de localitat es troba habitualment en diverses càrregues de treball reals, tal com estableix el principi de Pareto. Mesurem amb tres valors diferents, 1.0, 0.9 i 1.1, on 1.0 és la línia de base i 0.9 i 1.1 representen la càrrega de treball de localitat baixa i alta, respectivament.

El rendiment original de CoW varia segons les càrregues de treball, de manera que el període de fork per a una càrrega de treball es va establir segons el temps mesurat amb la configuració original de CoW. Per exemple, si la configuració original de CoW requereix 10 segons per recuperar el rendiment normal després d'afork, les altres configuracions de CCoW també bifurquen els processos secundaris cada 10 s.

La figura 5 resumeix el rendiment mitjà i l'ús de memòria de CCoW amb càrregues de treball de diferents localitats. Per a la càrrega de treball de localitat baixa, les configuracions amb llindars de CCoW petits presenten un millor rendiment que les que tenen llindars grans. "CCoW-all" fins i tot supera la CoW original en un 15% en la càrrega de treball de localitats baixes. Això es deu a l'eficàcia de la precòpia. A la càrrega de treball de baixa localitat, una gran part de la memòria s'hauria de replicar a mesura que els accessos s'estenen per tot l'espai d'adreces del procés. En efecte, la còpia de regions senceres provoca la còpia de la memòria necessària per endavant amb poca sobrecàrrega.

improve brain

Així, com més petit sigui el llindar, més gran serà el rendiment del programa amb la càrrega de treball de localitat baixa. No obstant això, aquesta tendència té l'efecte contrari amb les càrregues de treball d'alta localitat. Amb càrregues de treball d'alta localitat, molts accessos se centren en unes poques pàgines.

Això implica que només cal replicar una petita part de la memòria al llarg de la còpia-escriptura. En copiar tota la regió en un error de pàgina tendeix a copiar les pàgines a les quals no s'hi accedeix en absolut.

Això només comporta una sobrecàrrega temporal, perjudicant el rendiment amb càrregues de treball de localitats més altes. Com a resultat, CCoW-all presenta el pitjor rendiment amb la càrrega de treball d'alta localitat. Altres configuracions mostren patrons similars de càrregues de treball de referència; el rendiment arriba al valor del llindar del 80% i disminueix amb llindars més petits.

improving brain function

L'ús de la memòria del punt de referència mostra una tendència constant independentment del grau de localitat de les càrregues de treball. "CCoW-all" sempre representa l'ús de memòria més alt perquè sempre copia totes les pàgines de la memòria després d'una bifurcació. A més d'això, les petjades de memòria són inversament proporcionals al valor del llindar; com més petit sigui el valor del llindar, més memòria utilitza el punt de referència.

L'amplificació de la memòria només augmenta fins a un 10% en comparació amb la configuració original de CoW, que es considera que es troba en un rang raonable. A més d'analitzar el rendiment de CCoW, comparem el rendiment de CCoW amb el de la pàgina enorme transparent (THP) esquema de Linux.

THP és una mica semblant a CCoW, ja que té com a objectiu mitigar la sobrecàrrega originada a partir de pàgines petites. "CoW-THP" a la figura 5 representa el rendiment de la configuració habilitada per THP. Tingueu en compte que el sistema habilitat per THP gestiona CoW dividint pàgines grans en pàgines base abans de copiar la pàgina defectuosa, i també ho fan altres esquemes que optimitzen THP [12–15,17].

Podem observar que THP presenta un millor rendiment que la configuració predeterminada "només per a vaca". Atribuïm l'augment de rendiment a l'augment de l'eficiència en la traducció d'adreces amb pàgines enormes.

Concretament, segons l'esquema THP, és probable que la part calenta de l'espai d'adreces del procés estigui dividida en pàgines base, proporcionant així el mateix rendiment que la configuració "només CoW". Tanmateix, la part freda de l'espai d'adreces del procés no es divideix i es manté amb pàgines enormes. Per tant, això pot augmentar el rendiment de l'aplicació fins a cert punt.

Tanmateix, THP no proporciona tanta millora del rendiment com CCoW. La figura 6 mostra la distribució acumulada del rendiment durant l'avaluació. L'eix x representa el rendiment en operacions per segon i l'eix y representa la relació acumulada del rendiment a el valor de rendiment. Excepte CCoW-all, podem trobar tres intervals de rendiment observats amb freqüència, independentment de les configuracions.

El primer grup de la proporció acumulada de {{0}} a 0,1 indica el període durant el qual el rendiment de referència disminueix just després de la bifurcació. Aleshores, el rendiment recupera les hores extres, com en el segon grup amb una relació acumulada de 0,1 a 0,7.

Les ràtios acumulatives restants en l'interval de {{0}},7 a 1,0 provenen d'accessos que no incorren en errors de pàgina. En general, les configuracions CCoW solen tenir caigudes de rendiment més greus que la CoW original. Concretament, amb la càrrega de treball d'alta localitat de l'esquema original CoW, el rendiment es redueix a aproximadament 1900 K operacions per segon just després de la bifurcació.

improve memory

Aleshores augmenta lentament fins al rang de 2500 K operacions per segon. Amb CCoW, el rendiment va baixar més, fins al rang de 1700 K operacions per segon. No obstant això, el rendiment es va recuperar més ràpidament, demostrant un millor rendiment que el CoW original la major part del temps (és a dir, sobretot a la part dreta del gràfic acumulat). També podem observar una tendència similar d'altres càrregues de treball, i la configuració de CCoW-all demostra un comportament extrem; just després de la bifurcació, el rendiment baixa significativament i es manté baix mentre la major part de l'espai d'adreces es copia amb accessos estesos.

Després d'aquest punt, però, només es produeixen alguns errors de pàgina, de manera que la majoria dels accessos es processen sense errors de pàgina. Així, el rendiment té una distribució bimodal a CCoW. A partir d'aquesta avaluació, vam confirmar que CCoW proporciona un rendiment òptim optimitzant el cas comú.

No obstant això, la caiguda de rendiment s'ha d'abordar per obtenir millors característiques de rendiment. Amb aquesta finalitat, actualment estem treballant per limitar la quantitat de dades copiades just després de la bifurcació.

supplements to boost memory

4.2. Rendiment CCoW amb càrrega de treball realista

Per avaluar el CCoW proposat amb una càrrega de treball realista, hem utilitzat Redis i YCSB. El Redis és una base de dades de valors clau en memòria àmpliament utilitzada per accelerar aplicacions a escala d'Internet.

Hem utilitzat el punt de referència YCSB per omplir parells clau-valor en una instància de Redis i per realitzar-hi operacions. Concretament, la instància de Redis s'inicialitza amb 10 GB de parells clau-valor amb la configuració YCSB predeterminada.

Totes les claus i els valors tenen una mida de 23 i 100 bytes, respectivament, i cada clau conté 10 camps de valors. Després d'omplir la instància de Redis, la vam configurar per fer instantànies i després vam alimentar les operacions d'actualització amb YCSB.

Per incorporar la localitat temporal als accessos de valor-clau, hem configurat la càrrega de treball YCSB per seleccionar les claus de destinació segons la distribució Zip utilitzant el valor del paràmetre 1.0.

Mentre feia 100 GB d'actualitzacions, vam recopilar el rendiment de cada segon de l'informe de referència YCSB. La figura 7 resumeix el rendiment mitjà i l'ús de memòria de la instància Redis quan el sistema està configurat per utilitzar el CoW o CCoW original. Tingueu en compte que hem utilitzat 2 MB per a la mida de la regió i tots els valors de resultats es van normalitzar al de CoW.

improve cognitive function

En general, totes les configuracions de CCoW van superar la CoW original, independentment del llindar de cobertura. De la mateixa manera, com hem analitzat anteriorment, el rendiment es va determinar per la compensació entre el guany de rendiment de la còpia en escriptura mitigada i la sobrecàrrega de la còpia de pàgines addicionals. Quan el valor del llindar és alt, només es copien unes poques regions, fent que tant l'oportunitat d'optimització com la sobrecàrrega de memòria siguin petites.

Quan el valor del llindar disminueix per sota del 85%, l'empremta de memòria augmenta i comporta més despeses generals. Com a resultat, el rendiment mitjà de CCoW varia segons el llindar de cobertura, però demostra una millora del rendiment de fins a un 5% en comparació amb la CoW original.

Amb la càrrega de treball de Redis i YCSB, només vam observar una millora marginal del rendiment amb THP. Això es deu al fet que, en la càrrega de treball, els accessos d'escriptura es troben dispersos per tot l'espai d'adreces del procés i les pàgines enormes es divideixen efectivament en pàgines base mentre es maneja CoW.

Com que el procés Redis només pot tenir unes quantes pàgines enormes, el seu rendiment és similar al de la configuració base. Aquest resultat demostra que l'enfocament basat en THP és menys efectiu en càrregues de treball intensives en escriptura i CCoW supera el THP.

Per avaluar la precisió del mecanisme a l'hora d'identificar regions d'alta localitat, hem classificat el motiu del mecanisme de generació de còpies per a cada pàgina copiada. Concretament, hem recollit la proporció de pàgines copiades de totes les pàgines copiades. Quan la proporció de precòpia és x%, augmentant l'empremta total de memòria en y%, podem calcular la proporció de precòpia innecessària dividint y per x.

Per exemple, a la configuració CCoW-80, es copien el 26,9% de les pàgines copiades, augmentant la superfície de memòria en un 6,7%. Això implica que el 24,9% de les pàgines prèvies a la còpia no estan referenciades. La taula 1 resumeix el càlcul. La ràtio de precòpies innecessàries oscil·la entre el 23,4% i el 35,6%, i del resultat de l'avaluació es pot concloure que l'esquema proposat captura amb precisió les regions d'alta localitat.

improve working memory

5. Conclusions

En aquest estudi, vam proposar CCoW, un esquema de còpia sobre escriptura optimitzat per a càrregues de treball amb una localitat espacial elevada. CCoW divideix l'espai d'adreces del procés en regions i estima la seva localitat amb la cobertura.

Una escriptura a una regió d'alta localitat porta el gestor d'errors de pàgina a precopiar pàgines properes. Per fer un seguiment adequat de la cobertura després de la còpia prèvia, CCoW aprofita el bit brut de la taula de pàgines. L'avaluació amb punts de referència va confirmar que l'esquema proposat pot identificar regions d'alta localitat amb una petita sobrecàrrega, permetent un guany de rendiment de les aplicacions sense modificacions.

Com hem esmentat, el rendiment cau significativament just després de la bifurcació a causa de la gran quantitat de dades per copiar. Actualment estem treballant en la gestió del rendiment disminuint la velocitat de pre-còpia i realitzant la pre-còpia de manera asíncrona. També tenim previst incorporar un mecanisme adaptatiu que ajusti els paràmetres de configuració segons les característiques de la càrrega de treball actual.

Aportacions de l'autor: Conceptualització, MH i S.-HK; metodologia, MH; programari, MH;validació, MH i S.-HK; anàlisi formal, MH i S.-HK; investigació, MH, i S.-HK;recursos, S.-HK; curació de dades, MH; redacció-preparació de l'esborrany original, MH; redacció-revisió i edició, MH i S.-HK; visualització, MH; supervisió, S.-HK; administració de projectes, S.-HK; adquisició de finançament, S.-HK Tots els autors han llegit i acceptat la versió publicada del manuscrit.

boost memory

Finançament: aquesta investigació va comptar amb el suport d'una subvenció de l'Institut de Recerca en Electrònica i Telecomunicacions (ETRI) finançada pel govern coreà (20ZS1310) i el programa BK21 FOUR de la National Research Foundation of Korea finançat pel Ministeri d'Educació (NRF5199991014091).

Declaració de la Junta de Revisió Institucional: No aplicable.

Declaració de consentiment informat: no aplicable.

Declaració de disponibilitat de dades: no aplicable.

Conflictes d'interessos: els autors declaren no conflicte d'interessos.


Referències
1. Gorman, M. Comprensió del gestor de memòria virtual de Linux; Prentice Hall: Upper Saddle River, NJ, EUA, 2007.

2. Bovet, DP; Cesati, M. Comprendre el nucli de Linux; O'Reilly: Newton, MA, EUA, 2001.

3. Love, R. Linux Kernel Development, 3a ed.; Addison Wesley: Boston, MA, EUA, 2010.

4. Labs, R. Redis. Disponible en línia: https://github.com/redis/redis (consultat el 7 de juny de 2021).

5. Silberschatz, A.; Galvin, PB; Gagne, G. Conceptes de sistemes operatius; Addison-Wesley Longman Publishing Co., Inc.: Boston, MA, EUA, 2018.

6. Harris, SL; Harris, D. Disseny digital i arquitectura d'ordinadors; Morgan Kaufmann: Burlington, MA, EUA, 2022.

7. Abi-Chahla, F. Intel Core i7 (Nehalem): Arquitectura d'AMD? Disponible en línia: https://www.tomshardware.com/reviews/Intel-i7-nehalem-cpu,2041.html (consultat el 18 d'octubre de 2021).

8. Pham, B.; Bhattacharjee, A.; Eckert, Y.; Loh, GH Augment de l'abast de TLB aprofitant l'agrupació en les traduccions de pàgines. A Proceedingsof the 20th International Symposium IEEE 2014 on High-Performance Computer Architecture (HPCA'14), Orlando, FL, EUA, 15-19 de febrer de 2014; pàgines 558–567.


For more information:1950477648nn@gmail.com

Potser també t'agrada