Nous développons des sites web dynamiques java/PHP MySQL et je me pose
vraiment la question de savoir ce qu'est une grosse BDD....
Pour l'instant la plus grosse BDD que nous avons fait 300Mo, une quinzaine
de tables, la plus grosse table fait 100Mo et a 2 millions
d'enregistrements.
Nous ne faisons pas de recherches plein texte, uniquement sur des champs
indexés et tout se passe extrêmement bien....
Malgré celà, je me pose la question de savoir ce qu'on appelle une grosse
BDD.... et quels sont les critères qui permettent de quantifier l'ampleur
d'une BDD...?
Nous développons des sites web dynamiques java/PHP MySQL et je me pose vraiment la question de savoir ce qu'est une grosse BDD....
Déjà, on ne dit pas "grosse", on dit "un peu basse de potrine" !-)
Hein ? Comment ça je sors ? Ok, je sors...
Fred BROUARD - SQLpro
dans le monde de l'entreprise voici les chiffres :
NB user concurrents | Volume | Taille ------------------------------------------- 1 - 50 | 2 Go | petite 50 - 300 | 5 Go | moyenne 1 - 50 | 30 Go | moyenne 50 - 300 | 25 Go | grosse 1 - 50 | 200 Go | grosse 50 - 300 | 300 Go | très grosse 1 - 50 | 1 To | très grosse
Un petit exemple, il y a plus de 300 bases de données MS SQL Server qui dépassent actuellement en volume le Téra octets.
Attention, je parle de bases de type client serveur comme Oracle, IBM DB2, MS SQL Server, PostGreSQL, InterBase, Sybase ASE, etc...
ploc a écrit:
Nous développons des sites web dynamiques java/PHP MySQL et je me pose vraiment la question de savoir ce qu'est une grosse BDD....
Pour l'instant la plus grosse BDD que nous avons fait 300Mo, une quinzaine de tables, la plus grosse table fait 100Mo et a 2 millions d'enregistrements. Nous ne faisons pas de recherches plein texte, uniquement sur des champs indexés et tout se passe extrêmement bien....
Malgré celà, je me pose la question de savoir ce qu'on appelle une grosse BDD.... et quels sont les critères qui permettent de quantifier l'ampleur d'une BDD...?
Les critères sont simples : 1) volume des données 2) nombre d'utilisateurs concurrents (pas potentiels, mais connectés au même moment et en train de demander une requête) 3) nombre de transactions par minute (actuellement les plus grosses bases se situent entre 700 000 tpm et 3 200 000 tpm, voire le benchmark TPC-C à http://www.tpc.org/tpcc/results/tpcc_perf_results.asp)
A +
Merci pour vos réponses!
-- Frédéric BROUARD, MVP SQL Server. Expert SQL / spécialiste Delphi, web Livre SQL - col. Référence : http://sqlpro.developpez.com/bookSQL.html Le site du SQL, pour débutants et pros : http://sqlpro.developpez.com ************************ www.datasapiens.com *************************
dans le monde de l'entreprise voici les chiffres :
NB user concurrents | Volume | Taille
-------------------------------------------
1 - 50 | 2 Go | petite
50 - 300 | 5 Go | moyenne
1 - 50 | 30 Go | moyenne
50 - 300 | 25 Go | grosse
1 - 50 | 200 Go | grosse
50 - 300 | 300 Go | très grosse
1 - 50 | 1 To | très grosse
Un petit exemple, il y a plus de 300 bases de données MS SQL Server qui
dépassent actuellement en volume le Téra octets.
Attention, je parle de bases de type client serveur comme Oracle, IBM DB2, MS
SQL Server, PostGreSQL, InterBase, Sybase ASE, etc...
ploc a écrit:
Nous développons des sites web dynamiques java/PHP MySQL et je me pose
vraiment la question de savoir ce qu'est une grosse BDD....
Pour l'instant la plus grosse BDD que nous avons fait 300Mo, une quinzaine
de tables, la plus grosse table fait 100Mo et a 2 millions
d'enregistrements.
Nous ne faisons pas de recherches plein texte, uniquement sur des champs
indexés et tout se passe extrêmement bien....
Malgré celà, je me pose la question de savoir ce qu'on appelle une grosse
BDD.... et quels sont les critères qui permettent de quantifier l'ampleur
d'une BDD...?
Les critères sont simples :
1) volume des données
2) nombre d'utilisateurs concurrents (pas potentiels, mais connectés au même
moment et en train de demander une requête)
3) nombre de transactions par minute (actuellement les plus grosses bases se
situent entre 700 000 tpm et 3 200 000 tpm, voire le benchmark TPC-C à
http://www.tpc.org/tpcc/results/tpcc_perf_results.asp)
A +
Merci pour vos réponses!
--
Frédéric BROUARD, MVP SQL Server. Expert SQL / spécialiste Delphi, web
Livre SQL - col. Référence : http://sqlpro.developpez.com/bookSQL.html
Le site du SQL, pour débutants et pros : http://sqlpro.developpez.com
************************ www.datasapiens.com *************************
dans le monde de l'entreprise voici les chiffres :
NB user concurrents | Volume | Taille ------------------------------------------- 1 - 50 | 2 Go | petite 50 - 300 | 5 Go | moyenne 1 - 50 | 30 Go | moyenne 50 - 300 | 25 Go | grosse 1 - 50 | 200 Go | grosse 50 - 300 | 300 Go | très grosse 1 - 50 | 1 To | très grosse
Un petit exemple, il y a plus de 300 bases de données MS SQL Server qui dépassent actuellement en volume le Téra octets.
Attention, je parle de bases de type client serveur comme Oracle, IBM DB2, MS SQL Server, PostGreSQL, InterBase, Sybase ASE, etc...
ploc a écrit:
Nous développons des sites web dynamiques java/PHP MySQL et je me pose vraiment la question de savoir ce qu'est une grosse BDD....
Pour l'instant la plus grosse BDD que nous avons fait 300Mo, une quinzaine de tables, la plus grosse table fait 100Mo et a 2 millions d'enregistrements. Nous ne faisons pas de recherches plein texte, uniquement sur des champs indexés et tout se passe extrêmement bien....
Malgré celà, je me pose la question de savoir ce qu'on appelle une grosse BDD.... et quels sont les critères qui permettent de quantifier l'ampleur d'une BDD...?
Les critères sont simples : 1) volume des données 2) nombre d'utilisateurs concurrents (pas potentiels, mais connectés au même moment et en train de demander une requête) 3) nombre de transactions par minute (actuellement les plus grosses bases se situent entre 700 000 tpm et 3 200 000 tpm, voire le benchmark TPC-C à http://www.tpc.org/tpcc/results/tpcc_perf_results.asp)
A +
Merci pour vos réponses!
-- Frédéric BROUARD, MVP SQL Server. Expert SQL / spécialiste Delphi, web Livre SQL - col. Référence : http://sqlpro.developpez.com/bookSQL.html Le site du SQL, pour débutants et pros : http://sqlpro.developpez.com ************************ www.datasapiens.com *************************
Basile Starynkevitch [news]
On 2004-11-20, Fred BROUARD - SQLpro wrote:
dans le monde de l'entreprise voici les chiffres :
NB user concurrents | Volume | Taille ------------------------------------------- 1 - 50 | 2 Go | petite 50 - 300 | 5 Go | moyenne 1 - 50 | 30 Go | moyenne 50 - 300 | 25 Go | grosse 1 - 50 | 200 Go | grosse 50 - 300 | 300 Go | très grosse 1 - 50 | 1 To | très grosse
Un petit exemple, il y a plus de 300 bases de données MS SQL Server qui dépassent actuellement en volume le Téra octets.
Attention, je parle de bases de type client serveur comme Oracle, IBM DB2, MS SQL Server, PostGreSQL, InterBase, Sybase ASE, etc...
Il existe aussi des bases MySQL http://www.mysql.com/it-resources/case-studies/ ou PostgreSQL http://archives.postgresql.org/pgsql-advocacy/2002-08/msg00005.php de l'ordre du téraoctet (références trouvées avec Google). Et malgré les affirmations répétées de Fred, on peut considérer ces systèmes (dans leurs versions récentes) comme des SGBDR (en particulier, ils fournissent l'ACID-ité chère à Fred.)
Et pour ma part, je ne crois pas que le TeraOctet soit une très grosses base. J'ai entendu dure que FranceTelecom aurait une base (Oracle?) de l'ordre de la centaine de téraoctets, mais c'est peut-être une fausse rumeur. En tout cas, je la crois possible.
Je rappelle tout de même qu'un PostGresQL ou MySQL d'un teraoctet est aujourd'hui (en terme de coût d'installation) à la portée d'une PME ou d'un riche particulier (un rack de 10 disques de 200Go dépasse le To). Bien sûr, il reste à trouver ce téraoctet de données.
-- Basile STARYNKEVITCH http://starynkevitch.net/Basile/ email: basile<at>starynkevitch<dot>net aliases: basile<at>tunes<dot>org = bstarynk<at>nerim<dot>net 8, rue de la Faïencerie, 92340 Bourg La Reine, France
On 2004-11-20, Fred BROUARD - SQLpro <brouardf@club-internet.fr> wrote:
dans le monde de l'entreprise voici les chiffres :
NB user concurrents | Volume | Taille
-------------------------------------------
1 - 50 | 2 Go | petite
50 - 300 | 5 Go | moyenne
1 - 50 | 30 Go | moyenne
50 - 300 | 25 Go | grosse
1 - 50 | 200 Go | grosse
50 - 300 | 300 Go | très grosse
1 - 50 | 1 To | très grosse
Un petit exemple, il y a plus de 300 bases de données MS SQL Server qui
dépassent actuellement en volume le Téra octets.
Attention, je parle de bases de type client serveur comme Oracle, IBM DB2, MS
SQL Server, PostGreSQL, InterBase, Sybase ASE, etc...
Il existe aussi des bases MySQL
http://www.mysql.com/it-resources/case-studies/ ou PostgreSQL
http://archives.postgresql.org/pgsql-advocacy/2002-08/msg00005.php de
l'ordre du téraoctet (références trouvées avec Google). Et malgré
les affirmations répétées de Fred, on peut considérer ces systèmes
(dans leurs versions récentes) comme des SGBDR (en particulier, ils
fournissent l'ACID-ité chère à Fred.)
Et pour ma part, je ne crois pas que le TeraOctet soit une très
grosses base. J'ai entendu dure que FranceTelecom aurait une base
(Oracle?) de l'ordre de la centaine de téraoctets, mais c'est
peut-être une fausse rumeur. En tout cas, je la crois possible.
Je rappelle tout de même qu'un PostGresQL ou MySQL d'un teraoctet est
aujourd'hui (en terme de coût d'installation) à la portée d'une PME ou
d'un riche particulier (un rack de 10 disques de 200Go dépasse le
To). Bien sûr, il reste à trouver ce téraoctet de données.
--
Basile STARYNKEVITCH http://starynkevitch.net/Basile/
email: basile<at>starynkevitch<dot>net
aliases: basile<at>tunes<dot>org = bstarynk<at>nerim<dot>net
8, rue de la Faïencerie, 92340 Bourg La Reine, France
dans le monde de l'entreprise voici les chiffres :
NB user concurrents | Volume | Taille ------------------------------------------- 1 - 50 | 2 Go | petite 50 - 300 | 5 Go | moyenne 1 - 50 | 30 Go | moyenne 50 - 300 | 25 Go | grosse 1 - 50 | 200 Go | grosse 50 - 300 | 300 Go | très grosse 1 - 50 | 1 To | très grosse
Un petit exemple, il y a plus de 300 bases de données MS SQL Server qui dépassent actuellement en volume le Téra octets.
Attention, je parle de bases de type client serveur comme Oracle, IBM DB2, MS SQL Server, PostGreSQL, InterBase, Sybase ASE, etc...
Il existe aussi des bases MySQL http://www.mysql.com/it-resources/case-studies/ ou PostgreSQL http://archives.postgresql.org/pgsql-advocacy/2002-08/msg00005.php de l'ordre du téraoctet (références trouvées avec Google). Et malgré les affirmations répétées de Fred, on peut considérer ces systèmes (dans leurs versions récentes) comme des SGBDR (en particulier, ils fournissent l'ACID-ité chère à Fred.)
Et pour ma part, je ne crois pas que le TeraOctet soit une très grosses base. J'ai entendu dure que FranceTelecom aurait une base (Oracle?) de l'ordre de la centaine de téraoctets, mais c'est peut-être une fausse rumeur. En tout cas, je la crois possible.
Je rappelle tout de même qu'un PostGresQL ou MySQL d'un teraoctet est aujourd'hui (en terme de coût d'installation) à la portée d'une PME ou d'un riche particulier (un rack de 10 disques de 200Go dépasse le To). Bien sûr, il reste à trouver ce téraoctet de données.
-- Basile STARYNKEVITCH http://starynkevitch.net/Basile/ email: basile<at>starynkevitch<dot>net aliases: basile<at>tunes<dot>org = bstarynk<at>nerim<dot>net 8, rue de la Faïencerie, 92340 Bourg La Reine, France
see
Basile Starynkevitch wrote:
Il existe aussi des bases MySQL http://www.mysql.com/it-resources/case-studies/ ou PostgreSQL http://archives.postgresql.org/pgsql-advocacy/2002-08/msg00005.php de l'ordre du téraoctet (références trouvées avec Google). Et malgré les affirmations répétées de Fred, on peut considérer ces systèmes (dans leurs versions récentes) comme des SGBDR (en particulier, ils fournissent l'ACID-ité chère à Fred.)
Personnellement, je déconseillerai très fortement (en clair, c'est de l'inconscience pure et dure) à un client l'utilisation de MySQL pour gérer des bases qui dépassent la centaine de Go. Ou alors, on est dans des conditions très spécifiques (données non vitales, taux de disponibilité demandé faible, peu d'utilisateurs, ...)
Et pour ma part, je ne crois pas que le TeraOctet soit une très grosses base. J'ai entendu dure que FranceTelecom aurait une base (Oracle?) de l'ordre de la centaine de téraoctets, mais c'est peut-être une fausse rumeur. En tout cas, je la crois possible.
http://www.wintercorp.com/vldb/2003_TopTen_Survey/TopTenWinners.asp France Telecom, Datawarehouse de 30 To
Concernant les chiffres donnés par Frédéric, je suis en total accord avec lui (pour une fois ;-) )
Je rappelle tout de même qu'un PostGresQL ou MySQL d'un teraoctet est aujourd'hui (en terme de coût d'installation) à la portée d'une PME ou d'un riche particulier (un rack de 10 disques de 200Go dépasse le To). Bien sûr, il reste à trouver ce téraoctet de données.
Cette affirmation montre ton absence totale de connaissance de ce qu'est une grosse base de données et des contraintes que cela entraine.
Je suis bien d'accord que stocker quelques To de données sur des disques, c'est à la portée de n'importe qui et de n'importe quoi.
Par contre, quand il s'agit d'exploiter ces données, c'est une autre affaire. Dans exploiter, il faut comprendre : - faire des requêtes (en lecture, en modification) sur la base dans un temps raisonnable - avoir plusieurs dizaines d'utilisateur qui lance des requêtes sur la base en même temps - Assurer la sauvegarde de la base dans un temps raisonnable (quelques heures (3, 4) au maximum dans les cas les plus favorables, sans interruption de la base dans les cas les moins favrables)
Quand la base fait 1 To, assurer tous ces points demande un budget très conséquent.
Basile Starynkevitch wrote:
Il existe aussi des bases MySQL
http://www.mysql.com/it-resources/case-studies/ ou PostgreSQL
http://archives.postgresql.org/pgsql-advocacy/2002-08/msg00005.php de
l'ordre du téraoctet (références trouvées avec Google). Et malgré
les affirmations répétées de Fred, on peut considérer ces systèmes
(dans leurs versions récentes) comme des SGBDR (en particulier, ils
fournissent l'ACID-ité chère à Fred.)
Personnellement, je déconseillerai très fortement (en clair, c'est de
l'inconscience pure et dure) à un client l'utilisation de MySQL pour
gérer des bases qui dépassent la centaine de Go. Ou alors, on est dans
des conditions très spécifiques (données non vitales, taux de
disponibilité demandé faible, peu d'utilisateurs, ...)
Et pour ma part, je ne crois pas que le TeraOctet soit une très
grosses base. J'ai entendu dure que FranceTelecom aurait une base
(Oracle?) de l'ordre de la centaine de téraoctets, mais c'est
peut-être une fausse rumeur. En tout cas, je la crois possible.
http://www.wintercorp.com/vldb/2003_TopTen_Survey/TopTenWinners.asp
France Telecom, Datawarehouse de 30 To
Concernant les chiffres donnés par Frédéric, je suis en total accord
avec lui (pour une fois ;-) )
Je rappelle tout de même qu'un PostGresQL ou MySQL d'un teraoctet est
aujourd'hui (en terme de coût d'installation) à la portée d'une PME ou
d'un riche particulier (un rack de 10 disques de 200Go dépasse le
To). Bien sûr, il reste à trouver ce téraoctet de données.
Cette affirmation montre ton absence totale de connaissance de ce qu'est
une grosse base de données et des contraintes que cela entraine.
Je suis bien d'accord que stocker quelques To de données sur des
disques, c'est à la portée de n'importe qui et de n'importe quoi.
Par contre, quand il s'agit d'exploiter ces données, c'est une autre
affaire.
Dans exploiter, il faut comprendre :
- faire des requêtes (en lecture, en modification) sur la base dans un
temps raisonnable
- avoir plusieurs dizaines d'utilisateur qui lance des requêtes sur la
base en même temps
- Assurer la sauvegarde de la base dans un temps raisonnable (quelques
heures (3, 4) au maximum dans les cas les plus favorables, sans
interruption de la base dans les cas les moins favrables)
Quand la base fait 1 To, assurer tous ces points demande un budget très
conséquent.
Il existe aussi des bases MySQL http://www.mysql.com/it-resources/case-studies/ ou PostgreSQL http://archives.postgresql.org/pgsql-advocacy/2002-08/msg00005.php de l'ordre du téraoctet (références trouvées avec Google). Et malgré les affirmations répétées de Fred, on peut considérer ces systèmes (dans leurs versions récentes) comme des SGBDR (en particulier, ils fournissent l'ACID-ité chère à Fred.)
Personnellement, je déconseillerai très fortement (en clair, c'est de l'inconscience pure et dure) à un client l'utilisation de MySQL pour gérer des bases qui dépassent la centaine de Go. Ou alors, on est dans des conditions très spécifiques (données non vitales, taux de disponibilité demandé faible, peu d'utilisateurs, ...)
Et pour ma part, je ne crois pas que le TeraOctet soit une très grosses base. J'ai entendu dure que FranceTelecom aurait une base (Oracle?) de l'ordre de la centaine de téraoctets, mais c'est peut-être une fausse rumeur. En tout cas, je la crois possible.
http://www.wintercorp.com/vldb/2003_TopTen_Survey/TopTenWinners.asp France Telecom, Datawarehouse de 30 To
Concernant les chiffres donnés par Frédéric, je suis en total accord avec lui (pour une fois ;-) )
Je rappelle tout de même qu'un PostGresQL ou MySQL d'un teraoctet est aujourd'hui (en terme de coût d'installation) à la portée d'une PME ou d'un riche particulier (un rack de 10 disques de 200Go dépasse le To). Bien sûr, il reste à trouver ce téraoctet de données.
Cette affirmation montre ton absence totale de connaissance de ce qu'est une grosse base de données et des contraintes que cela entraine.
Je suis bien d'accord que stocker quelques To de données sur des disques, c'est à la portée de n'importe qui et de n'importe quoi.
Par contre, quand il s'agit d'exploiter ces données, c'est une autre affaire. Dans exploiter, il faut comprendre : - faire des requêtes (en lecture, en modification) sur la base dans un temps raisonnable - avoir plusieurs dizaines d'utilisateur qui lance des requêtes sur la base en même temps - Assurer la sauvegarde de la base dans un temps raisonnable (quelques heures (3, 4) au maximum dans les cas les plus favorables, sans interruption de la base dans les cas les moins favrables)
Quand la base fait 1 To, assurer tous ces points demande un budget très conséquent.