Whamcloud - gitweb
- more fixes with hash_segment calculation. make them similar during split and
[fs/lustre-release.git] / lustre / cmm / mdc_object.c
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  *  lustre/cmm/mdc_object.c
5  *  Lustre Cluster Metadata Manager (cmm)
6  *
7  *  Copyright (c) 2006 Cluster File Systems, Inc.
8  *   Author: Mike Pershin <tappro@clusterfs.com>
9  *
10  *   This file is part of the Lustre file system, http://www.lustre.org
11  *   Lustre is a trademark of Cluster File Systems, Inc.
12  *
13  *   You may have signed or agreed to another license before downloading
14  *   this software.  If so, you are bound by the terms and conditions
15  *   of that agreement, and the following does not apply to you.  See the
16  *   LICENSE file included with this distribution for more information.
17  *
18  *   If you did not agree to a different license, then this copy of Lustre
19  *   is open source software; you can redistribute it and/or modify it
20  *   under the terms of version 2 of the GNU General Public License as
21  *   published by the Free Software Foundation.
22  *
23  *   In either case, Lustre is distributed in the hope that it will be
24  *   useful, but WITHOUT ANY WARRANTY; without even the implied warranty
25  *   of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
26  *   license text for more details.
27  */
28
29 #ifndef EXPORT_SYMTAB
30 # define EXPORT_SYMTAB
31 #endif
32
33 #define DEBUG_SUBSYSTEM S_MDS
34 #include <obd_support.h>
35 #include <lustre_lib.h>
36 #include <obd_class.h>
37 #include <lustre_mdc.h>
38 #include "cmm_internal.h"
39 #include "mdc_internal.h"
40
41 static struct md_object_operations mdc_mo_ops;
42 static struct md_dir_operations mdc_dir_ops;
43 static struct lu_object_operations mdc_obj_ops;
44
45 extern struct lu_context_key mdc_thread_key;
46
47 struct lu_object *mdc_object_alloc(const struct lu_env *env,
48                                    const struct lu_object_header *hdr,
49                                    struct lu_device *ld)
50 {
51         struct mdc_object *mco;
52         ENTRY;
53
54         OBD_ALLOC_PTR(mco);
55         if (mco != NULL) {
56                 struct lu_object *lo;
57
58                 lo = &mco->mco_obj.mo_lu;
59                 lu_object_init(lo, NULL, ld);
60                 mco->mco_obj.mo_ops = &mdc_mo_ops;
61                 mco->mco_obj.mo_dir_ops = &mdc_dir_ops;
62                 lo->lo_ops = &mdc_obj_ops;
63                 RETURN(lo);
64         } else
65                 RETURN(NULL);
66 }
67
68 static void mdc_object_free(const struct lu_env *env, struct lu_object *lo)
69 {
70         struct mdc_object *mco = lu2mdc_obj(lo);
71         lu_object_fini(lo);
72         OBD_FREE_PTR(mco);
73 }
74
75 static int mdc_object_init(const struct lu_env *env, struct lu_object *lo)
76 {
77         ENTRY;
78         lo->lo_header->loh_attr |= LOHA_REMOTE;
79         RETURN(0);
80 }
81
82 static int mdc_object_print(const struct lu_env *env, void *cookie,
83                             lu_printer_t p, const struct lu_object *lo)
84 {
85         return (*p)(env, cookie, LUSTRE_CMM_MDC_NAME"-object@%p", lo);
86 }
87
88 static struct lu_object_operations mdc_obj_ops = {
89         .loo_object_init    = mdc_object_init,
90         .loo_object_free    = mdc_object_free,
91         .loo_object_print   = mdc_object_print,
92 };
93
94 /* md_object_operations */
95 static
96 struct mdc_thread_info *mdc_info_get(const struct lu_env *env)
97 {
98         struct mdc_thread_info *mci;
99
100         mci = lu_context_key_get(&env->le_ctx, &mdc_thread_key);
101         LASSERT(mci);
102         return mci;
103 }
104
105 static
106 struct mdc_thread_info *mdc_info_init(const struct lu_env *env)
107 {
108         struct mdc_thread_info *mci;
109
110         mci = mdc_info_get(env);
111
112         memset(mci, 0, sizeof(*mci));
113
114         return mci;
115 }
116
117 static void mdc_body2attr(struct mdt_body *body, struct md_attr *ma)
118 {
119         struct lu_attr *la = &ma->ma_attr;
120         /* update time */
121         if (body->valid & OBD_MD_FLCTIME && body->ctime >= la->la_ctime) {
122                 la->la_ctime = body->ctime;
123                 if (body->valid & OBD_MD_FLMTIME)
124                         la->la_mtime = body->mtime;
125         }
126
127         if (body->valid & OBD_MD_FLMODE)
128                 la->la_mode = body->mode;
129         if (body->valid & OBD_MD_FLSIZE)
130                 la->la_size = body->size;
131         if (body->valid & OBD_MD_FLBLOCKS)
132                 la->la_blocks = body->blocks;
133         if (body->valid & OBD_MD_FLUID)
134                 la->la_uid = body->uid;
135         if (body->valid & OBD_MD_FLGID)
136                 la->la_gid = body->gid;
137         if (body->valid & OBD_MD_FLFLAGS)
138                 la->la_flags = body->flags;
139         if (body->valid & OBD_MD_FLNLINK)
140                 la->la_nlink = body->nlink;
141         if (body->valid & OBD_MD_FLRDEV)
142                 la->la_rdev = body->rdev;
143
144         ma->ma_valid = MA_INODE;
145 }
146
147 static int mdc_req2attr_update(const struct lu_env *env,
148                                 struct md_attr *ma)
149 {
150         struct mdc_thread_info *mci;
151         struct ptlrpc_request *req;
152         struct mdt_body *body;
153         struct lov_mds_md *lov;
154         struct llog_cookie *cookie;
155
156         ENTRY;
157         mci = mdc_info_get(env);
158         req = mci->mci_req;
159         LASSERT(req);
160         body = lustre_msg_buf(req->rq_repmsg, REPLY_REC_OFF, sizeof(*body));
161         LASSERT(body);
162         mdc_body2attr(body, ma);
163
164         if (!(body->valid & OBD_MD_FLEASIZE))
165                 RETURN(0);
166
167         if (body->eadatasize == 0) {
168                 CERROR("OBD_MD_FLEASIZE is set but eadatasize is zero\n");
169                 RETURN(-EPROTO);
170         }
171
172         lov = lustre_swab_repbuf(req, REPLY_REC_OFF + 1,
173                                  body->eadatasize, NULL);
174         if (lov == NULL) {
175                 CERROR("Can't unpack MDS EA data\n");
176                 RETURN(-EPROTO);
177         }
178
179         LASSERT(ma->ma_lmm != NULL);
180         LASSERT(ma->ma_lmm_size >= body->eadatasize); 
181         ma->ma_lmm_size = body->eadatasize;
182         memcpy(ma->ma_lmm, lov, ma->ma_lmm_size);
183         ma->ma_valid |= MA_LOV;
184         if (!(body->valid & OBD_MD_FLCOOKIE))
185                 RETURN(0);
186
187         if (body->aclsize == 0) {
188                 CERROR("OBD_MD_FLCOOKIE is set but cookie size is zero\n");
189                 RETURN(-EPROTO);
190         }
191
192         cookie = lustre_msg_buf(req->rq_repmsg,
193                                 REPLY_REC_OFF + 2, body->aclsize);
194         if (cookie == NULL) {
195                 CERROR("Can't unpack unlink cookie data\n");
196                 RETURN(-EPROTO);
197         }
198
199         LASSERT(ma->ma_cookie != NULL);
200         LASSERT(ma->ma_cookie_size == body->aclsize);
201         memcpy(ma->ma_cookie, cookie, ma->ma_cookie_size);
202         ma->ma_valid |= MA_COOKIE;
203         RETURN(0);
204 }
205
206 static int mdc_attr_get(const struct lu_env *env, struct md_object *mo,
207                         struct md_attr *ma)
208 {
209         struct mdc_device *mc = md2mdc_dev(md_obj2dev(mo));
210         struct mdc_thread_info *mci;
211         int rc;
212         ENTRY;
213
214         mci = lu_context_key_get(&env->le_ctx, &mdc_thread_key);
215         LASSERT(mci);
216
217         memset(&mci->mci_opdata, 0, sizeof(mci->mci_opdata));
218
219         rc = md_getattr(mc->mc_desc.cl_exp, lu_object_fid(&mo->mo_lu), NULL,
220                         OBD_MD_FLMODE | OBD_MD_FLUID | OBD_MD_FLGID |
221                         OBD_MD_FLFLAGS,
222                         0, &mci->mci_req);
223         if (rc == 0) {
224                 /* get attr from request */
225                 rc = mdc_req2attr_update(env, ma);
226         }
227
228         ptlrpc_req_finished(mci->mci_req);
229
230         RETURN(rc);
231 }
232
233
234 static int mdc_object_create(const struct lu_env *env,
235                              struct md_object *mo,
236                              const struct md_create_spec *spec,
237                              struct md_attr *ma)
238 {
239         struct mdc_device *mc = md2mdc_dev(md_obj2dev(mo));
240         struct lu_attr *la = &ma->ma_attr;
241         struct mdc_thread_info *mci;
242         const void *symname;
243         struct md_ucred *uc = md_ucred(env);
244         int rc, symlen;
245         uid_t uid;
246         gid_t gid;
247         __u32 cap;
248         ENTRY;
249
250         LASSERT(spec->u.sp_pfid != NULL);
251         LASSERT(S_ISDIR(la->la_mode));
252         mci = mdc_info_init(env);
253         mci->mci_opdata.fid2 = *lu_object_fid(&mo->mo_lu);
254         /* parent fid is needed to create dotdot on the remote node */
255         mci->mci_opdata.fid1 = *(spec->u.sp_pfid);
256         mci->mci_opdata.mod_time = la->la_mtime;
257         if (uc &&
258             ((uc->mu_valid == UCRED_OLD) || (uc->mu_valid == UCRED_NEW))) {
259                 uid = uc->mu_fsuid;
260                 if (la->la_mode & S_ISGID)
261                         gid = la->la_gid;
262                 else
263                         gid = uc->mu_fsgid;
264                 cap = uc->mu_cap;
265                 if (uc->mu_ginfo || (uc->mu_valid == UCRED_OLD))
266                         mci->mci_opdata.suppgids[0] = uc->mu_suppgids[0];
267                 else
268                         mci->mci_opdata.suppgids[0] = -1;
269         } else {
270                 uid = la->la_uid;
271                 gid = la->la_gid;
272                 cap = 0;
273                 mci->mci_opdata.suppgids[0] = -1;
274         }
275
276         /* get data from spec */
277         if (spec->sp_cr_flags & MDS_CREATE_SLAVE_OBJ) {
278                 symname = spec->u.sp_ea.eadata;
279                 symlen = spec->u.sp_ea.eadatalen;
280                 mci->mci_opdata.fid1 = *(spec->u.sp_ea.fid);
281                 mci->mci_opdata.flags |= MDS_CREATE_SLAVE_OBJ;
282 #ifdef CONFIG_FS_POSIX_ACL
283         } else if (spec->sp_cr_flags & MDS_CREATE_RMT_ACL) {
284                 symname = spec->u.sp_ea.eadata;
285                 symlen = spec->u.sp_ea.eadatalen;
286                 mci->mci_opdata.flags |= MDS_CREATE_RMT_ACL;
287 #endif
288         } else {
289                 symname = spec->u.sp_symname;
290                 symlen = symname ? strlen(symname) + 1 : 0;
291         }
292
293         rc = md_create(mc->mc_desc.cl_exp, &mci->mci_opdata,
294                        symname, symlen,
295                        la->la_mode, uid, gid, cap, la->la_rdev,
296                        &mci->mci_req);
297
298         if (rc == 0) {
299                 /* get attr from request */
300                 rc = mdc_req2attr_update(env, ma);
301         }
302
303         ptlrpc_req_finished(mci->mci_req);
304
305         RETURN(rc);
306 }
307
308 static int mdc_ref_add(const struct lu_env *env, struct md_object *mo)
309 {
310         struct mdc_device *mc = md2mdc_dev(md_obj2dev(mo));
311         struct mdc_thread_info *mci;
312         struct md_ucred *uc = md_ucred(env);
313         int rc;
314         ENTRY;
315
316         mci = lu_context_key_get(&env->le_ctx, &mdc_thread_key);
317         LASSERT(mci);
318
319         memset(&mci->mci_opdata, 0, sizeof(mci->mci_opdata));
320         mci->mci_opdata.fid1 = *lu_object_fid(&mo->mo_lu);
321         //mci->mci_opdata.mod_time = la->la_ctime;
322         //mci->mci_opdata.fsuid = la->la_uid;
323         //mci->mci_opdata.fsgid = la->la_gid;
324         mci->mci_opdata.mod_time = CURRENT_SECONDS;
325         if (uc &&
326             ((uc->mu_valid == UCRED_OLD) || (uc->mu_valid == UCRED_NEW))) {
327                 mci->mci_opdata.fsuid = uc->mu_fsuid;
328                 mci->mci_opdata.fsgid = uc->mu_fsgid;
329                 mci->mci_opdata.cap = uc->mu_cap;
330                 if (uc->mu_ginfo || (uc->mu_valid == UCRED_OLD)) {
331                         mci->mci_opdata.suppgids[0] = uc->mu_suppgids[0];
332                         mci->mci_opdata.suppgids[1] = uc->mu_suppgids[1];
333                 } else {
334                         mci->mci_opdata.suppgids[0] =
335                                 mci->mci_opdata.suppgids[1] = -1;
336                 }
337         } else {
338                 mci->mci_opdata.fsuid = current->fsuid;
339                 mci->mci_opdata.fsgid = current->fsgid;
340                 mci->mci_opdata.cap = current->cap_effective;
341                 mci->mci_opdata.suppgids[0] = mci->mci_opdata.suppgids[1] = -1;
342         }
343
344
345         rc = md_link(mc->mc_desc.cl_exp, &mci->mci_opdata, &mci->mci_req);
346
347         ptlrpc_req_finished(mci->mci_req);
348
349         RETURN(rc);
350 }
351
352 static int mdc_ref_del(const struct lu_env *env, struct md_object *mo,
353                        struct md_attr *ma)
354 {
355         struct mdc_device *mc = md2mdc_dev(md_obj2dev(mo));
356         struct lu_attr *la = &ma->ma_attr;
357         struct mdc_thread_info *mci;
358         struct md_ucred *uc = md_ucred(env);
359         int rc;
360         ENTRY;
361
362         mci = mdc_info_init(env);
363         mci->mci_opdata.fid1 = *lu_object_fid(&mo->mo_lu);
364         mci->mci_opdata.mode = la->la_mode;
365         mci->mci_opdata.mod_time = la->la_ctime;
366         if (uc &&
367             ((uc->mu_valid == UCRED_OLD) || (uc->mu_valid == UCRED_NEW))) {
368                 mci->mci_opdata.fsuid = uc->mu_fsuid;
369                 mci->mci_opdata.fsgid = uc->mu_fsgid;
370                 mci->mci_opdata.cap = uc->mu_cap;
371                 if (uc->mu_ginfo || (uc->mu_valid == UCRED_OLD))
372                         mci->mci_opdata.suppgids[0] = uc->mu_suppgids[0];
373                 else
374                         mci->mci_opdata.suppgids[0] = -1;
375         } else {
376                 mci->mci_opdata.fsuid = la->la_uid;
377                 mci->mci_opdata.fsgid = la->la_gid;
378                 mci->mci_opdata.cap = current->cap_effective;
379                 mci->mci_opdata.suppgids[0] = -1;
380         }
381
382         rc = md_unlink(mc->mc_desc.cl_exp, &mci->mci_opdata, &mci->mci_req);
383         if (rc == 0) {
384                 /* get attr from request */
385                 rc = mdc_req2attr_update(env, ma);
386         }
387
388         ptlrpc_req_finished(mci->mci_req);
389
390         RETURN(rc);
391 }
392
393 #ifdef HAVE_SPLIT_SUPPORT
394 int mdc_send_page(struct cmm_device *cm, const struct lu_env *env,
395                   struct md_object *mo, struct page *page, __u32 offset)
396 {
397         struct mdc_device *mc = md2mdc_dev(md_obj2dev(mo));
398         int rc;
399         ENTRY;
400
401         rc = mdc_sendpage(mc->mc_desc.cl_exp, lu_object_fid(&mo->mo_lu),
402                           page, offset);
403         CDEBUG(rc ? D_ERROR : D_INFO, "send page %p  offset %d fid "DFID" rc %d \n",
404                page, offset, PFID(lu_object_fid(&mo->mo_lu)), rc);
405         RETURN(rc);
406 }
407 #endif
408
409 static struct md_object_operations mdc_mo_ops = {
410         .moo_attr_get       = mdc_attr_get,
411         .moo_object_create  = mdc_object_create,
412         .moo_ref_add        = mdc_ref_add,
413         .moo_ref_del        = mdc_ref_del,
414 };
415
416 /* md_dir_operations */
417 static int mdc_rename_tgt(const struct lu_env *env, struct md_object *mo_p,
418                           struct md_object *mo_t, const struct lu_fid *lf,
419                           const char *name, struct md_attr *ma)
420 {
421         struct mdc_device *mc = md2mdc_dev(md_obj2dev(mo_p));
422         struct lu_attr *la = &ma->ma_attr;
423         struct mdc_thread_info *mci;
424         struct md_ucred *uc = md_ucred(env);
425         int rc;
426         ENTRY;
427
428         mci = mdc_info_init(env);
429         mci->mci_opdata.fid1 = *lu_object_fid(&mo_p->mo_lu);
430         mci->mci_opdata.fid2 = *lf;
431         mci->mci_opdata.mode = la->la_mode;
432         mci->mci_opdata.mod_time = la->la_ctime;
433         if (uc &&
434             ((uc->mu_valid == UCRED_OLD) || (uc->mu_valid == UCRED_NEW))) {
435                 mci->mci_opdata.fsuid = uc->mu_fsuid;
436                 mci->mci_opdata.fsgid = uc->mu_fsgid;
437                 mci->mci_opdata.cap = uc->mu_cap;
438                 if (uc->mu_ginfo || (uc->mu_valid == UCRED_OLD)) {
439                         mci->mci_opdata.suppgids[0] = uc->mu_suppgids[0];
440                         mci->mci_opdata.suppgids[1] = uc->mu_suppgids[1];
441                 } else {
442                         mci->mci_opdata.suppgids[0] =
443                                 mci->mci_opdata.suppgids[1] = -1;
444                 }
445         } else {
446                 mci->mci_opdata.fsuid = la->la_uid;
447                 mci->mci_opdata.fsgid = la->la_gid;
448                 mci->mci_opdata.cap = current->cap_effective;
449                 mci->mci_opdata.suppgids[0] = mci->mci_opdata.suppgids[1] = -1;
450         }
451
452         rc = md_rename(mc->mc_desc.cl_exp, &mci->mci_opdata, NULL, 0,
453                        name, strlen(name), &mci->mci_req);
454         if (rc == 0) {
455                 /* get attr from request */
456                 mdc_req2attr_update(env, ma);
457         }
458
459         ptlrpc_req_finished(mci->mci_req);
460
461         RETURN(rc);
462 }
463 /* 
464  * Return resulting fid in sfid
465  * 0: fids are not relatives
466  * fid: fid at which search stopped
467  */
468 static int mdc_is_subdir(const struct lu_env *env, struct md_object *mo,
469                          const struct lu_fid *fid, struct lu_fid *sfid)
470 {
471         struct mdc_device *mc = md2mdc_dev(md_obj2dev(mo));
472         struct mdc_thread_info *mci;
473         struct mdt_body *body;
474         int rc;
475         ENTRY;
476
477         mci = mdc_info_init(env);
478
479         rc = md_is_subdir(mc->mc_desc.cl_exp, lu_object_fid(&mo->mo_lu),
480                           fid, &mci->mci_req);
481         if (rc == 0 || rc == -EREMOTE) {
482                 body = lustre_msg_buf(mci->mci_req->rq_repmsg, REPLY_REC_OFF,
483                                       sizeof(*body));
484                 LASSERT(body->valid & OBD_MD_FLID);
485         
486                 CDEBUG(D_INFO, "Remote mdo_is_subdir(), new src "DFID"\n",
487                        PFID(&body->fid1));
488                 *sfid = body->fid1;
489         }
490         ptlrpc_req_finished(mci->mci_req);
491         RETURN(rc);
492 }
493
494 static struct md_dir_operations mdc_dir_ops = {
495         .mdo_is_subdir   = mdc_is_subdir,
496         .mdo_rename_tgt  = mdc_rename_tgt
497 };