News
Using perfSONAR to test university network capabilities
Across the globe, National Research and Education Networks (NRENs) rely on a shared monitoring framework, called perfSONAR, to monitor their network performance. This framework provides "federated" coverage of paths across different networks and geographic borders. That means it gives better end-to-end updates to individual networks of their performance and helps to isolate problems that may be affecting everyone.
The Canadian NREN has been using perfSONAR for several years. CANARIE has supported the purchase of standardized equipment and implementation by each NREN partner, to ensure a common focus on maintaining the performance of this fast, reliable network. In this post, I will break down the experience by ACORN-NS (the research and education network provider for Nova Scotia) of using perfSONAR to test the network speed for Cape Breton University. The results of this project could be useful to other institutions who are looking to maximize their research network capabilities.
Background
As part of our NREN perfSONAR speed testing project, ACORN-NS acquired two servers. One was sent to the gigapop (gigabit point-of-presence) at the Dalhousie Studley Campus in Halifax, to remain in stationary use there. The plan for the second server was for it to be moved around to different member and affiliate locations, to run remote testing as required.
In December 2018, the mobile testing server was shipped to Cape Breton University (CBU) in Sydney, where the CBU technicians, in collaboration with the ACORN-NS team, successfully ran the prescribed tests.
However, we realized that more testing (on a more permanent basis) would provide much greater benefit to both the university and ACORN-NS. We have now decided to purchase additional servers to deploy at our 11 member institutions, so that each can continue to operate its own monitoring system. This will have the added bonus of allowing ACORN-NS to set up a permanent dashboard and provide regular reporting on the performance of the network within Nova Scotia, while still contributing to the national dashboard with CANARIE and other NREN partners.
The Results from Cape Breton University
The purpose of having a perfSONAR instance at CBU was to determine the real-world health and speed of the ACORN-NS network. This, in turn, would help identify deficiencies and provide guidance for future upgrades.
Testing Methodology
A 1U Dell Server was shipped to CBU and connected via a 1GbE connection within a single hop of the ACORN-NS network, and outside any traffic shaping or firewall devices. Bandwidth and latency tests between CBU and Halifax were scheduled every 4 and 6 hours, respectively, and testing ran over the period of a week.
Test Results
As you can see from the scales in the two graphs below:
- Overall, there was little evidence of any deficiencies at 1GbE between CBU and Halifax.
- Throughput was between 83-92% theoretical line speed, which is near the maximum expected for a majority of these tests.
- The graph shows a few “dips,” which likely represent increased traffic / load either at the Halifax or the CBU end, but these are the exception.
- Latency between the two sites was also near the maximum expected, based on the number of hops and the speed of light.
- The average latency was 4.5ms, with a spike of over 5ms, and one instance where packet loss was up to 1%.
The Need For Further Testing - Next Steps
The connection between CBU and Halifax, when measured at 1GbE, showed no evidence of issues and performed as expected, with minor variations that one would normally see on a live network. However, we quickly realized that this data has limited value, as it only reflects a 1GbE connection. Our network should theoretically be able to achieve a higher speed.
We are now planning to run further tests of the full link speed of the ACORN-NS link, with each member institution, to ensure we are getting a proper picture of our network's real-world performance and capacity. This activity, including procurement and implementation of the small-form-factor devices, is scheduled for summer and fall 2019.
Lessons Learned
Running this testing was a relatively easy exercise. Creating a virtual machine (VM) environment was easier than shipping the hardware remotely for the one-time testing activity. This is what led us to look at a more permanent solution for each site.
To perform the tests, the sender and receiver had to maintain the minimum connection speed on each end. For ACORN-NS institutions testing to their core, this was 1-10 Gb. To test the connection nationally, none of the members (except Dalhousie/ACORN-NS) have the ability to scale on their own beyond 10Gb, to achieve the 20+ Gb upper limit of the CANARIE connection.
Advice for other institutions running perfSONAR tests?
Institutions looking to utilize perfSONAR should take advantage of national standards for hardware and software, and the testing requirements currently being developed by the NREN Tech Committee. There is currently an ansible standard hardware installation routine being developed that should be useful once available.
Finally, to facilitate a more comprehensive test, it is advisable to increase server throughput to match the national NREN minimum testing requirements, which prescribe scaling beyond 10Gb.
Vérification des capacités du réseau universitaire avec perfSONAR
Partout sur la planète, les Réseaux nationaux de la recherche et de l’éducation (RNRE) recourent à un cadre de surveillance commun appelé perfSONAR pour suivre la performance de leur réseau. Ce cadre assure une couverture "fédérée" des trajets suivis le long des diffrents rseaux, travers les frontires. En dautres termes, il procure chaque RNRE un meilleur tableau actuel de la performance de son rseau, ce qui lui permet disoler les problmes susceptibles daffecter les autres RNRE.
Le RNRE canadien utilise perfSONAR depuis plusieurs années déjà. CANARIE a facilité l’acquisition de l’équipement standard et son installation par chacun des partenaires du RNRE, afin qu’on accorde une attention commune à la performance de ce réseau, aussi rapide que fiable. Dans ce billet, je relaterai l’expérience vécue par ACORN-NS (le fournisseur du réseau de la recherche et de l’éducation pour la Nouvelle-ÈÉ cosse) lorsqu’il s’est servi de perfSONAR pour tester la rapidité de son réseau à l’Université du Cap Breton. Les résultats de ce projet pourraient s’avérer utiles aux autres institutions qui envisagent d’optimiser les capacités de leur propre réseau de recherche.
Contexte
Dans le cadre du projet visant à tester la vitesse du RNRE avec perfSONAR, ACORN-NS s’est procuré deux serveurs. Le premier a été expédié au gigaPOP (point de présence gigabit) du campus Studley de l’Université Dalhousie, à Halifax, où son usage devait rester stationnaire. Le second devait voyager d’un membre du réseau à l’autre, et aux divers sites affiliés, pour les essais effectués à distance.
En décembre 2018, le serveur employé pour les essais itinérants a été expédié à l’Université du Cap Breton (UCB), à Sydney, dont les techniciens ont procédé aux tests prescrits avec brio, en collaboration avec leurs collègues d’ACORN-NS.
Nous avons néanmoins constaté que des essais plus nombreux (ou sur une base plus permanente) s’avéreraient nettement plus utiles pour l’université et ACORN-NS. En conséquence, nous avons décidé d’acheter des serveurs supplémentaires qui seront déployés dans les onze institutions membres, afin que chacune ait son propre système de surveillance. Autre avantage, ACORN-NS pourra créer un tableau de bord permanent et remettre régulièrement un rapport sur la performance du réseau en Nouvelle-Ècosse, tout en continuant de participer au tableau de bord national avec CANARIE et les autres partenaires du RNRE.
Résultats de l’Université du Cap Breton
En installant une instance de perfSONAR à l’UCB, on souhaitait vérifier la solidité et la rapidité réelles du réseau d’ACORN-NS, ce qui concourrait à en déterminer les carences et à orienter ses améliorations futures.
Méthode expérimentale
Un serveur Dell 1U a été expédié à l’Université du Cap Breton et branché par liaison de 1 GbE en un seul saut au réseau ACORN-NS, sans passer par les dispositifs structurant le trafic ou agissant comme pare- feu. La largeur de bande et la latence entre l’université et Halifax ont été testées pendant une semaine, toutes les quatre et six heures, respectivement.
Résultats
Les deux diagrammes ci-dessous illustrent ce qui suit.
- De manière générale, la liaison de 1 GbE entre l’Université du Cap Breton et Halifax présente peu de carences.
- Le débit se situait entre 83 et 92 % de la vitesse théorique de la liaison, ce qui est proche du maximum auquel on s’attend pour la plupart des essais de cette nature.
- Le graphique montre quelques « chutes », qui correspondent sans doute à une hausse du trafic ou de la charge entre les deux points, mais ce ne sont que des exceptions.
- La latence entre les deux points se situe aussi près du maximum prévu, compte tenu du nombre de sauts et de la vitesse de la lumière.
- En moyenne, la latence est de 4,5 ms, avec un pic au-dessus de 5 ms et un cas où l’on a enregistré la perte de jusqu’à un pour cent des paquets.
Nécessité d’autres tests : prochaines étapes
Quand on la mesure à 1 GbE, la connexion entre l’Université du Cap Breton et Halifax ne présente aucun problème et fonctionne comme prévu, avec les légères fluctuations que l’on juge normales dans le fonctionnement d’un réseau. Cependant, on s’est vite rendu compte que ces données n’ont qu’une utilité restreinte, du fait qu’elles ne s’appliquent qu’à une connexion de 1GbE. En effet, la vitesse que peut atteindre le réseau, en théorie, est nettement plus élevée.
Nous envisageons maintenant d’autres essais à la vitesse maximale de la liaison entre ACORN-NS et chacune des institutions qui en font partie, en vue de brosser un tableau exact de la performance et de la capacité réelles du réseau. Le projet, qui comprend la fourniture et l’installation d’appareils à petit coefficient de forme, devrait se dérouler durant l’été et l’automne 2019.
Enseignements
Ces essais constituaient un exercice passablement facile. Créer un environnement de machines virtuelles (MV) est plus simple qu’expédier du matériel à un site éloigné pour un test ponctuel. C’est ce qui nous a incités à envisager une solution plus permanente pour chaque site.
Pour effectuer les tests, l’expéditeur et le récepteur devaient maintenir la vitesse de connexion minimale à chaque extrémité, soit d’un à dix gigabits pour les institutions raccordées à ACORN-NS. Or aucune institution raccordée au réseau provincial (sauf l’Université Dalhousie) ne peut dépasser la vitesse de 10 Gb requise pour tester la connexion à l’échelle nationale jusqu’à la limite supérieure de 20 Gb et plus qu’autorise la connexion avec CANARIE.
Conseil aux institutions qui effectuent des essais avec perfSONAR
Les institutions qui aimeraient utiliser perfSONAR devraient se fonder sur les normes nationales établies pour l’équipement et les logiciels, ainsi que tenir compte des contraintes concernant les tests qu’élabore le comité technique du RNRE. Une routine Ansible est en train d’être mise au point pour l’installation du matériel et devrait s’avérer utile une fois qu’elle aura été achevée.
Enfin, pour un test plus complet, il vaut mieux augmenter le débit du serveur jusqu’au minimum requis pour les essais du RNRE sur le plan national, c’est-à-dire à une échelle supérieure à 10 Gb.